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Prefacio 


Desde principios del siglo XX hasta mediados de los años sesenta, el estudio 
del aprendizaje constituyó el eje del estudio de la psicología em Norteamérica. 
Eminentes investigadores del aprendizaje, como Hull, Spence, Mowrer, Tolman, 
Miller y Skinner, eran considerados figuras eminentes del conjunto de la psicolo- 
gía antes que figuras importantes de una subespecialidad. En ese período, el 
empeño principal era el de elaborar una teoría general de la conducta sobre la 
base de extensas investigaciones de laboratorio de unas cuantas situaciones expe- 
rimentales especializadas. Los hallazgos resultantes de esos estudios se emplearon 
- para construir teorías del aprendizaje y de la conducta que se suponían aplicables 
a una diversidad de especies y circunstancias. Los conceptos y hallazgos se 
emplearon igualmente para construir modelos de la conducta anormal, la perso- 
nalidad y la adquisición de destrezas especiales, como el lenguaje. Á los estudian- 
tes de psicología se les enseñaba antes que nada los principios del aprendizaje y la 
conducta, y ello aunque fueran a especializarse en cualquier otro área. 

La psicología ha cambiado espectacularmente en los últumos 20-25 años a 
causa del desarrollo de subdisciplinas como la psicología cognitiva, la psicolingiís- 
tica, la psicología fisiológica, la genética de la conducta y la psicología evolutiva. 
El estudio del aprendizaje y la conducta ya no ocupa la posición dominante de que 
un día disfrutó. Pero sigue siendo un área vital de investigación que se ocupa de 
ciertos aspectos fundamentales del modo en que la conducta es gobernada por los 
acontecimientos del medio. El estudio contemporáneo del aprendizaje y la con- 
ducta se ve enriquecido por numerosos hallazgos nuevos y por modos de pensar 
también nuevos. Nuestras .ideas básicas en torno al condicionamiento clásico y el 
instrumental han experimentado profundos cambios en los últimos 15 años, y 
este vigoroso proceso continúa. Por añadidura, el estudio del condicionamiento y 
el aprendizaje se integra cada vez mejor con las investigaciones afines en torno a 
las bases biológicas de la conducta y con el estudio de los procesos cognitivos. 

Las investigaciones de condicionamiento y aprendizaje también aportan técni- 
cas para el análisis de la conducta que resultan inestimables en muchos campos de 
aparición reciente, como la neurociencia conductual, la psicobiología evolutiva, la 
psicofarmacología, la medicina conductual, la toxicología conductual y la teratolo- 
gta. Los espectaculares avances de la neurofisiología renuevan la esperanza de un 
pronto descubrimiento de los sustratos neurológicos del aprendizaje, y este reno- 
vado interés por la neurofisiología del aprendizaje da lugar, a su vez, a un resur- 
gimiento del interés por los mecanismos conductuales básicos del aprendizaje. 
Así, aunque el estudio del condicionamiento y el aprendizaje comenzó siendo 
asunto principalmente de psicólogos, ahora es parte integral de una amplia red de 
enfoques interdisciplinarios que se ocupan del estudio de la conducta. 

El propósito de nuestro libro es presentar a los estudiantes las investigaciones 
contemporáneas sobre el aprendizaje y la conducta. Nos ha guiado el deseo de 
abundar en la elaboración teórica y el desarrollo de las ideas antes que el de 
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familiarizar al estudiante con todas las complicaciones que a menudo acompañan 
a las investigaciones concretas. Los antecedentes históricos de las ideas se tratan 
sólo en tanto en cuanto sean importantes para la comprensión de problemas 
actuales. Debido a los rápidos e importantes cambios que en este campo se produ- 
cen, algunas de las ideas contemporáneas sobre el aprendizaje y la conducta toda- 
vía no pueden integrarse plenamente con los hallazgos anteriores. Con.todo, tra- 
tamos de ofrecer un enfoque integrado cuando es posible. Por ejemplo, la reciente 
información sobre las limitaciones biológicas del aprendizaje se entreteje en la 
trama del texto en vez de discutirse en un capítulo aparte, divorciada de los 
fenómenos básicos del condicionamiento. 

Para ayudar al estudiante, ilustramos con numerosos ejemplos los puntos 
principales del texto. La mayoría de los ejemplos experimentales se han tomado 
de la investigación animal. Sin embargo, nos referimos con frecuencia a la poten- 
cial relevancia de los hallazgos y conceptos para el análisis de la conducta 
humana. Por añadidura, nos hemos tomado la libertad de repasar ciertas ideas 
considerando situaciones humanas similares. Estas ampliaciones a la conducta 
humana deben entenderse como tema de reflexión más que como resultado de un 
razonamiento científico propiamente tal, Los términos técnicos se escriben en 
negrita cuando aparecen por primera vez, con objeto de que el lector pueda iden- 
tificarlos con facilidad. 

El libro está organizado de forma jerárquica y los primeros capítulos sientan 
la base para la información que se ofrece después. Sin embargo, los conceptos se 
repiten cuando aparecen con posterioridad, de forma que leer un capitulo no 
exige necesariamente haber leído todos los anteriores. El libro comienza con una 
enunciación de los elementos básicos del enfoque conductual del estudio de la 
psicología, una definición del aprendizaje y algunos comentarios sobre los antece- 
dentes históricos del estudio del aprendizaje y la conducta. El capítulo 2 describe 
la conducta elicitada y dos de los procesos más elementales de cambio de la con- 
ducta, la habituación y la sensibilización. Se describen luego, en orden de creciente 
complejidad, diversos procedimientos y fenómenos de condicionamiento y apren- 
dizaje. Los capítulos 3 y 4 recogen algunas cuestiones antiguas y muchas contem- 
poráneas en torno al condicionamiento clásico. Los conceptos básicos y los fun- 
damentos teóricos del estudio del condicionamiento instrumental se recogen en el 
capitulo 5. El capítulo 6 está dedicado a la descripción de los programas de refor- 
zamiento y la conducta de elección; las cuestiones teóricas concernientes a los 
mecanismos del reforzamiento se tratan en el capítulo 7. Los capitulo 8, 9 y 10 se 
refieren a aquellos procedimientos y fenómenos que se han analizado en términos 
de interacción de los procesos de condicionamiento clásico e instrumental. El 
capítulo 8 trata del control por el estímulo en la conducta aprendida. La evitación 
y el castigo se tratan en el capítulo 9, y el capítulo 10 se refiere de forma más 
general a las cuestiones teóricas relacionadas con la interacción de los procesos de 
condicionamiento clásico e instrumental, Los dos últimos capítulos del libro reco- 
gen parte de la extensa investigación reciente sobre la cognición animal. El capí- 
tulo 11 se ocupa de los mecanismos de la memoria, y el capítulo 12 describe 
diversos mecanismos de procesamiento de la información, entre los que se cuen- 
tan timing, counting, el aprendizaje de patrones seriales, la formación de con- 
ceptos, el razonamiento y el lenguaje, en animales no humanos. 

La presente edición del libro, aunque semejante a la primera edición por los 
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objetivos y el enfoque básico, difiere de la primera edición en muchos detalles. 
Por ejemplo, la materia tratada en los capítulos 2 y 3 de la primera edición se ha 
agrupado aquí en un solo capítulo, y la consideración de las investigaciones sobre 
cognición animal se ha ampliado de un capítulo a dos. Buscábamos con estos 
diversos cambios dotar de mayor claridad al texto e incorporar numerosos hallaz- 
gos experimentales e ideas cuya notoriedad es posterior a la publicación de la 
primera edición. Hemos trabajado en todo momento con el propósito de elaborar 
un libro que constituya, esperamos, un reflejo del campo de estudio razonable- 
mente preciso. Uno de nosotros (M. D.) se responsabilizó primordialmente de 
reescribir el texto básico, y el otro (B. B.) se responsabilizó primordialmente de 
proporcionar nuevos ejemplos de las aplicaciones de los principios del aprendi- 
zaje y la conducta a los problemas de la conducta humana. 

Estamos en deuda con muchas personas, entre las que se cuentan J. J. B. 
Ayres, P. Balsam, M. Bouton, M. Cantor, M. Fanselow, C. Flaherty, A. W. Logue, 
M. Rashotte, D. Thomas, W. Timberlake y G: Whitney, que hicieron interesantes 
sugerencias sobre la revisión de la primera edición del libro y atrajeron nuestra 
atención a nuevas e importantes áreas de investigación. Agradecemos también los 
comentarios que sobre el primer borrador del libro recibimos de numerosas per- 
sonas, entre las que se cuentan James Allison, de la Universidad de Indiana; 
Michael R. Best, de la Southern Methodist University; Douglas Gillan, de la Loc- 
kheed Corporation; Bill Gordon, de la Universidad de Nuevo México; Peter 
Killen, de la Universidad de Texas en Austin; Richard Miller, de la Universidad 
de Western Kentucky; David Riccio, de la Kent State University; Mark Rilling, 
de la Michigan State University; Robert A. Rosellini, de la State University de 
Nueva York en Albany; Michael Scavio, de la California State University, Fuller- 
ton; W. Scott Terry, de la Universidad de North Carolina en Charlotte; Ronald 
Ulm, del Salisbury State College; Gary Walters, de la Universidad de Toronto; 
Edward Wasserman, de la Universidad de lowa, y Ben Williams, de la Universi- 
dad de California en San Diego. También queremos dar las gracias al personal de 
Brooks/Cole por su continuo apoyo al libro: C. Deborah Laughton por animarnos 
a emprender la revisión, Fiorella Ljunggren por encargarse de la producción del 
libro y a Rephap Berg por la pericia con que preparó la edición del manuscrito. 
Finalmente, queremos dar las gracias a Nancy Marlin, por escribir Directed 
Readings for Domjan y Burkbard's Principles of Learning and Behavior, 2* edi- 
ción (Brooks/Cole, 1986), como compañero del presente texto, y a Stuart Hall, 
que nos ayudó en el trabajo con el banco de pruebas utilizado para nuestro libro. 


Michael Domjan 
Barbara Burkbard 


Capítulo 1 
INTRODUCCION 


El capítulo 1 tiene por objeto introducir a los estudiantes en el estudio del 
aprendizaje y de la conducta, y en el método de investigación utilizado en este 
campo. Los modernos experimentos sobre aprendizaje se basan en el enfoque 
conductual del estudio de la psicología. Este capítulo describe el enfoque conduc- 
tual y sus antecedentes históricos, y compara este enfoque con otras estrategias 
usadas en el estudio de la psicología. Teniendo en cuenta que se han realizado 
numerosos experimentos de aprendizaje con sujetos animales, se expone el 
motivo de utilizar sujetos animales en investigación, y la posibilidad de generali- 
zación de los resultados de las investigaciones sobre aprendizaje animal. El capí- 
tulo acaba con una discusión sobre la relación entre las investigaciones conductua- 
les y otros aspectos de la psicología. 


REFLEXIONES INFORMALES SOBRE LA CONDUCTA 
INCONVENIENTES DE LAS REFLEXIONES INFORMALES SOBRE LA 
CONDUCTA 
EL ENFOQUE CONDUCTUAL EN EL ESTUDIO DE LA PSICOLOGIA 
ANTECEDENTES HISTORICOS DEL ENFOQUE CONDUCTUAL 
El dualismo cartesiano 
Hitos históricos en el estudio de la mente 
Hitos históricos en el estudio de los reflejos 
Charles Darwin y el concepto de evolución 
El enfoque conductual en su contexto histórico 
EL APRENDIZAJE Y EL ESTUDIO DE LA CONDUCTA 
Definición de aprendizaje 
Distinción entre el aprendizaje y otras causas de cambio en la conducta 
EL EE DE ANIMALES EN LAS INVESTIGACIONES SOBRE APRENDI- 
Ventajas prácticas del uso de animales 
Ventajas conceptuales del uso de animales 
Los animales de laboratorio y la conducta normal 
Generalización de los resultados del aprendizaje animal 
EL ENFOQUE CONDUCTUAL Y OTROS ASPECTOS DE LA PSICOLOGIA 


La gente siempre se ha interesado por entender su propia conducta y la de los 
demás. Este interés es algo más que mera curiosidad. Dado que vivimos en una 
sociedad compleja, muchos aspectos de nuestras vidas están gobernados por las 
acciones de otros. La cantidad de dinero que uno gana en su trabajo depende de lo 
que el jefe decida darle. Que la vida en el hogar nos resulte agradable o no, 
depende de lo complaciente u hostil que sea la persona con quien lo compartimos. 
Que a uno lo admitan o no en la facultad depende de la decistón del responsable 
de admisión. Llegar puntual al colegio depende del tráfico y de cómo haya sido 
reparado el coche la última vez que se lo llevó al taller. 

Como dependemos en gran medida de otras personas en casi todos los aspec- 
tos de nuestra vida, es importante para nosotros predecir el comportamiento de 
los demás. La vida sería insoportable si uno no pudiera predecir cuándo está su 
madre a punto de regañarle, o cuándo va a tener clase, o si el dependiente de la 
tienda de ultramarinos nos va a agredir en vez de registrar nuestras compras. 
Gran parte de nuestro interés en la conducta está motivado por el deseo de prede- 
cir mejor las acciones de los demás. 


REFLEXIONES INFORMALES SOBRE LA CONDUCTA 


Existen muchos enfoques para la comprensión y predicción de la conducta, 
desde la lectura de los posos del té hasta la observación científica, Cada uno 
adopta sus propias estrategias para descifrar por qué actúan los otros como lo 
hacen. Sin embargo, las distintas reflexiones informales sobre la conducta poseen 
a veces rasgos comunes. En primer lugar, a falta de una formación específica en 
psicología, cuando queremos entender por qué alguien se comporta de una forma 
determinada, probablemente lo que hacemos es pensar cómo actuaríamos noso- 
“tros ea una situación parecida. Esto es, reflexionando sobre nuestras propías 
razones para hacer algo, tratamos de formarnos una idea de los motivos por los 
que actúan los demás. Este método para alcanzar una comprensión de la conducta 
se llama introspección informal. En la historía del hombre la introspección ha 
sido el medio principal de obtener información sobre la conducta. Sin embargo, la 
introspección informal no se usa en investigaciones sistemáticas de la conducta. 
Muchas áreas de la psicología han abandonado por completo el uso de la Íntros- 
pección. En otras áreas, la introspección se utiliza solamente en circunstancias 
muy restringidas y controladas. Por ejemplo, a un sujeto se le puede pedir que 
responda a una pregunta de un cuestionario cuidadosamente redactado, O que 
emita un juicio sobre un estímulo presentado en una situación de laboratorio. 
Aquellos que carecen de una formación en psicología, además de utilizar la 
introspección como método primordial para descifrar la conducra, muy probable- 
mente arribuirán las acciones a fuerzas internas de los que las realizan. Es decir, 
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supondrán que la conducta está originada por factores internos, como el. libre 
albedrío o los deseos de la persona. Si vemos a alguien correr hacia la parada del 


autobús es probable que demos por supuesto que la persona quiere coger el auto- 


bús. Si un amigo nuestro pasa mucho tiempo estudiando, interpretamos que 
quiere sacar buenas notas. Con frecuencia se recurre a la motivación interna para 
explicar la conducta de los animales. Si un perro se queda de pie frente a una . 
puerta, probablemente diremos que quiere salir. Si un gato salta sobre la encimera 
de la cocina cuando se está preparando la cena es probable que lleguemos a la 
conclusión de que quiere robar comida. 

La tercera característica común de las reflexiones informales acerca de la con- 
ducta es que se plantean en términos de unidades de conducta amplias y comple- 
jas. Basándonos en su conducta describimos a las personas como enérgicas, listas, 
educadas, enfadadas, contentas o enamoradas. Cada uno de estos términos des- 
cribe una serie completa de actividades. Por ejemplo, estar enamorado puede 
implicar llamar por teléfono con frecuencia a la persona amada, no prestar mucha 
atención a otras personas, llegar con antelación, por impaciencia, a una cita con la 
persona amada, comprar regalos, ser mucho más cuidadoso de lo normal con el 
aspecto físico, etcétera. De forma similar, el estar enfadado conlleva muchas res- 
puestas. Una persona enfadada puede gritar, amenazar, arrojar cosas, conducir 
demasiado rápido, o llegar a la agresión física. 


INCONVENIENTES DE LAS REFLEXIONES INFORMALES SOBRE LA 
CONDUCTA 


Las reflexiones informales no han contribuido mucho a la comprensión de la 
conducta, debido a su dependencia de la introspección no sistemática, a su concen- 
tración en las causas internas, y a que toman en consideración unidades de con- 
ducta amplias y complejas. Cada uno de estos aspectos del enfoque informal tiene 
ciertas deficiencias. > 

La introspección no sistemática no suele ser muy útil para aumentar nuestra 
comprensión de la conducta, pues la gente no es muy hábil para interpretar 
correctamente su propia conducta. Las explicaciones introspectivas de la conducta 
a menudo sólo sirven para uno mismo y son enormemente imprecisas. Una per- 
sona con peso excesivo puede decirnos que casi nunca come entre horas aunque 
de hecho esté casi siempre picando. Un hombre con dificultades matrimoniales 
puede verse a sí mismo como un esposo modelo al que su mujer ignora, cuando, 
en realidad, es él quien rara vez la piropea o le presta atención. Hay padres que 
creen estar muy interesados en lo que hacen sus hijos adolescentes cuando a lo 
mejor no les preguntan por sus actividades más de una o dos veces a la semana. Á 
menudo la tarea del terapeuta consiste en rechazar tales autoexplicaciones sobre 
la conducta, y enseñar a la gente a prestar más atención a lo que realmente hace. 
Por ejemplo, a la persona que pesa demasiado se le puede pedir que cada vez que 
come algo lo anote en un diario. 

Si al hacer reflexiones informales sobre el comportamiento centramos nuestra 
atención en buscar el origen interno de la motivación, a menudo obtenemos una 
comprensión significativa de la conducta, El problema mayor, en este caso, es que 


. nO disponemos de una prueba independiente del motivo inferido. Más bien infe- 


- 


PRINCIPIOS DE APRENDIZAJE Y DE CONDUCTA ZA 


rimos la causa interna de una acción a partir de aquella conducta que estamos 
tratando de explicar y, por tanto, la «explicación» no nos proporciona ninguna 
información nueva acerca de la conducta. Considérese, por ejemplo, el caso de un 
extraño corriendo hacia la parada del autobús. Es probable que expliquemos esta 
conducta recurriendo a los motivos internos, diciendo que la persona está inten- 
tando coger el autobús. Sin embargo, tal uso de un motivo interno no nos ayuda a 
entender la conducta, porque no tenemos una prueba independiente de que la 
persona está intentando coger el autobús. (A lo mejor corre a una oficina cer- 
cana.) Como la única evidencia que tenemos de la existencia de un motivo interno 
es la conducta que estamos tratando de explicar, al postular ese motivo interno no 


añadimos nueva información ni aumentamos nuestra comprensión de la conducta. 


Los motivos internos a los que se recurre en las reflexiones informales sobre 
la conducta se infieren a menudo de la conducta misma. Podríamos decir que 
María intenta preparar bien un examen puesto que pasa mucho tiempo en la 
biblioteca, que Joe debe tener hambre porque corre a coger su comida y se la come 
deprisa, o que Beth no debe de tener mucho interés en el club porque siempre 
llega tarde a las reuniones. Esta clase de motivos internos tergiversan la com- 
prensión, y de hecho pueden ser totalmente incorrectos. La verdad puede ser que 
María pasa mucho tiempo en la biblioteca porque está intentando llamar la aten- 
ción de alguien, que Joe corre a comer la comida porque está impaciente por ir a 
jugar al baloncesto, y que Beth llega normalmente tarde a las reuniones del club 
porque su babysitter no puede llegar antes a su casa. Los motivos internos resul- 
tan útiles para explicar la conducta sólo si la prueba de que existen estos motivos 
proviene de otras fuentes, independientes de aquella conducta que estamos 
intentando explicar. Por ejemplo, la suposición de que María está intentando 
preparar bien un examen sería una explicación que daría sentido al tiempo que 
pasa en la biblioteca si supiéramos que ella se va a presentar a una oposición. A 
menudo no nos preocupamos por obtener una evidencia sobre la conducta inde- 
pendiente de los motivos informales internos. 

La tercera característica de las reflexiones informales sobre la conducta —cen- 
trar la atención en unidades de conducta amplias y complejas— también impide a 
veces la comprensión de los procesos conductuales. Experiencias como el amor 
(en su sentido más amplio) son muy complejas, y es muy probable que estén 
determinadas por multitud de factores. Para poder comprender esos procesos psi- 
cológicos tan complicados, primero tenemos que definir y analizar sus componen- 
tes. Los patrones de las conductas simples están regidos probablemente por 
mecanismos poco complicados, que deberían ser más fáciles de descubrir. El cono- 
cimiento adquirido a partir de las investigaciones sobre respuestas elementales 
puede utilizarse, entonces, como guía en el estudio de sistemas conductuales más 
complejos. 


EL ENFOQUE CONDUCTUAL EN EL ESTUDIO DE LA PSICOLOGIA 


Como ya se ha visto, las reflexiones informales rara vez proporcionan una 
comprensión significativa de la conducta, pues con frecuencia se apoyan en una 
introspección defectuosa y en motivos internos no confirmados, y porque una de 
sus características es que se suelen referir a unidades de conducta amplias y com- 


y 
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pléjas. El enfoque para el estudio de la conducta que se describe en este libro 
difiere de las reflexiones informales en varios puntos importantes. No confía en 
la introspección, no hace inferencias a la ligera sobre causas internas de la con- 
ducta, y se centra más en las unidades de conducta reducidas que en las amplias. 
Nosotros definimos esto como enfoque conductual para remarcar que el objeto 
principal de estudio es la conducta de los organismos. 

El método de investigación en que se apoyan los estudios conductuales es el 
mismo que se utiliza en las ciencias naturales —la biología, la física y la 
química—. Básicamente, los estudios conductuales se centran en los aspectos de la 
conducta que pueden ser observados desde fuera, de forma que cualquiera que lo 
desee puede verificar las observaciones. Para facilitar la recogida de datos, los 
experimentos se realizan, a veces, con aparatos de registro automático, como 
cámaras de cine o de vídeo, o con microconmutadores, que registran cada una de 
las veces que un animal provoca un cambio en el medio circundante. En la figura 
1.1 se muestra una situación experimental frecuente. Este aparato se utiliza para 
estudiar la conducta de picoteo de las palomas y otras aves. Cada vez que el ave da 
un picotazo en la tecla de respuesta, desplaza la tecla ligeramente y este despla- 
zamiento queda registrado automáticamente en los contadores, los gráficos o 
cualquier otro aparato. . 

Al haberse centrado el interés de las investigaciones conductuales sólo en el 
estudio de aquellos aspectos de la psicología que pueden ser observados de una 
Equipo automático de programación y registro 


e 


Alimentador automático 





Fsgura 1.1.—Equipo para el estudio del picoteo de una tecla con palomas y otras aves. El animal es 

colocado en un pequeño recinto que contiene una tecla de respuesta. Cada vez que el pájaro picotea la 

tecla, ésta se desplaza ligeramente, y este desplazamiento queda automáticamente registrado en conta- 
dores, gráficas en papel o algún otro dispositivo. 


' 
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forma objetivamente verificable, estas investigaciones ham quedado, a menudo, 
limitadas a las respuestas observables. Muchos experimentos consistían en medir 
las acciones y movimientos de los animales. Otras respuestas de naturaleza más 
fisiológica también pueden ser medidas de forma objetiva. Algunos experimentos 
miden, por ejemplo, la salivación, el nivel de azúcar en la sangre, la actividad 
eléctrica del cerebro o el ritmo cardiaco. Los experimentos sobre la conducta no 
han hecho más que empezar a dirigir su atención a temas como el pensamiento, 
la forma en que se recuerda la información o cómo los organismos razonan e 
imaginan soluciones a problemas. Describiremos algunas de estas investigaciones 
en los capítulos 11 y 12. Sin embargo, la mayor parte del libro tratará de las 
causas de las respuestas motoras y emocionales: cómo aprendemos a manejarnos 
en nuestro medio, cómo aprendemos buenos modales, y por qué nos gustan cier- 
tas experiencias tales como jugar al fútbol. Este libro no tratará, por ejemplo, 
de cuáles son los procesos de pensamiento implicados en la resolución de proble- 
mas matemáticos. Sin embargo, discutirá por qué estudiamos temas de matemáti- 
Cas, por qué vamos a clase de matemáticas, y por qué pueden no gustarnos las 
matemáticas. 

Una segunda diferencia importante entre las investigaciones conductuales y 
las reflexiones informales sobre la conducta, es que el enfoque conductual no 
busca las causas de la conducta únicamente dentro del organismo. Por el contra- 
rio, se hace fundamental asumir que los organismos modifican su conducta para 
acoplarla a las demandas del ambiente, La forma en que hacen esto depende, a 
menudo, de la motivación y de otros procesos internos. Se considera, sin embargo, 
que el papel de los procesos internos consiste en hacer al individuo más (o 
menos) sensible ante ciertos estímulos externos, no que esos procesos internos 
sean la única causa de una conducta concreta, Así, por ejemplo, los animales son 
más sensibles a los estímulos relacionados con la comida cuando tienen hambre, y 
son más sensibles a los miembros del otro sexo cuando su estado hormonal los 
hace sexualmente receptivos. 

Hay quien cree que estudiando sólo las acciones que están controladas por el 
ambiente externo, uno queda limitado a aspectos poco interesantes de la conducta. 
Según esta idea, la conducta que se da como respuesta a estímulos externos es 
refleja, y los reflejos se consideran simples, automáticos, y reacciones invariables a 
estímulos elicitantes específicos. Por tanto, se supone que un análisis conductual 
no puede tener en cuenta lo impredecible, ni la flexibilidad y complejidad de cada 
situación. Esta opinión no se puede justificar por dos razones. Primera, estudiar 
solamente las respuestas que están controladas por el ambiente externo no limita 
las investigaciones a la conducta refleja. A nosotros también nos interesa la con- 
ducta dirigida a una meta, como la de buscar comida. La respuesta dirigida a una 
meta no es una respuesta a un estímulo elicitante específico. Antes bien, está 
regida en su mayor parte por estímulos que van indicando la naturaleza y locali- 
zación de la meta codiciada (como puede ser la comida). Segundo, la conducta 
refleja no es necesariamente simple, automática e invariable. Oír una música que 
nos conmueve, O ver una buena película, suscita en nosotros reacciones emociona- 
les complejas, que son respuestas muy alejadas de los reflejos simples, tales como 
una reacción de temblor después de oír un ruido fuerte y súbito, o la contracción 
de las pupilas de los ojos como respuesta a un resplandor de luz. Adernás, muchos 
estímulos no se dan cada vez que se presenta el estímulo elicitante apropiado. 
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Uno de los objetivos de este libro es demostrar la riqueza, complejidad y variabi- 
lidad de la conducta que aparece como respuesta a los acontecimientos ambienta- 
les externos. 

Por último, a diferencia de las reflexiones informales, el enfoque conductual se 
ocupa de pequeñas unidades de conducta. De hecho, muchas investigaciones con 
una orientación conductual sobre los procesos psicológicos complejos empiezan 
por definir un tipo de respuesta restringida que se considera indicativo de los 
procesos de interés. Por ejemplo, el acopio de comida en las ratas puede definirse 
en términos de la frecuencia con que la rata presiona la palanca para obtener la 
comida como premio. La agresión puede definirse en función de la frecuencia con 
que los monos muerden un tubo de gorna cuando son estimulados aversivamente, 
y el miedo puede definirse en función de la rapidez con que uno escapa de una 
situación peligrosa. Evidentemente, el estudio científico de la conducta también 
puede aplicarse a formas de conducta más complejas. Sin embargo, la mayor parte 
de las investigaciones no han sido de este tipo. 


ANTECEDENTES HISTORICOS DEL ENFOQUE CONDUCTUAL 
El dualismo cartesiano 


El enfoque conductual del estudio de la psicología podría tener su origen en el 
filósofo francés René Descartes (1596-1650). Antes de Descartes, la creencia 
común era que la conducta humana estaba totalmente determinada por el propó- 
sito consciente y el libre albedrío. No se pensaba en absoluto que estímulos exter- 
nos, O leyes naturales mecánicas, controlaran las acctones de las personas. Se 


suponia que las acciones de cada uno eran el resultado de una intención delibe- 


rada. Esta visión acerca de la naturaleza humana quedó desautorizada al advertir 
Descartes que muchas de las cosas que hacen las personas son reacciones automá- 
ticas a estímulos externos. Sin embargo, mo estaba preparado para abandonar 
totalmente la idea del libre albedrío y del control consciente de las propias accio- 
nes. Por tanto, formuló una visión dualista de la conducta humana conocida como 
dualismo cartesiano. Según este punto de vista, hay dos aspectos en la conducta 
humana, Algunas acciones son involuntarias y tienen lugar como respuesta a 
estímulos externos. Á estas acciones se les llama reflejos. Otro aspecto de la 
conducta humana implica acciones voluntarias que no tienen que ser desencade- 
nadas por estímulos externos y que aparecen porque una persona elige actuar de 
esa manera. 

La visión dualista de Descartes sobre la conducta humana aparece esquemati- 
zada en la fig. 1.2. Consideremos en primer lugar el mecanismo de la conducta 
involuntaria o refleja. Los estímulos ambientales son detectados por los Órganos 
de los sentidos de la persona. La información sensorial es trasmitida al cerebro a 
través de los nervios. Desde el cerebro, el impulso para la acción se envía a través 
de los nervios hasta los músculos, los cuales realizan la respuesta involuntaria. 
Así pues, la conducta involuntaria implica la transformación a través del cerebro 
de un estímulo o entrada en una respuesta o salida. 

Existen varios aspectos de este sistema que son dignos de mención. Se consi- 
dera que los estímulos del ambiente exterior son la causa de toda conducta invo- 
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Figura 1.2.—Diagrama del dualismo cartesiano. Los acontecimientos del mundo físico son detectados 

por los órganos sensoriales, desde donde son conducidos hasta el cerebro. El cerebro está conectado a 

la mente por medio de la glándula pineal. El acto involuntario está producido por un arco reflejo que 

comprende los mensajes enviados primero desde.los órganos sensoriales al cerebro, y después desde el 

cerebro a los músculos, Los acros voluntarios se generan en la mente, con instrucciones enviadas al 
cerebro y luego a los músculos. 


luntaria. Estos estímulos producen respuestas involuntarias por medio de un cir- 
cuito neuronal que incluye al cerebro. Sin embargo, sólo interviene un conjunto de 
nervios. Descartes supuso que los nervios que trasmitían la información desde los 
órganos de los sentidos hasta el cerebro eran los mismos que la trasmirían desde 
el cerebro hasta los músculos. Este circuito, creía él, permitía unas reacciones 
rápidas a los estímulos externos, como sucede al retirar la mano rápidamente de 
un horno caliente. 

Descartes opinaba que los mecanismos involuntarios de conducta eran los úni- 
cos de que disponían los animales. Según esta opinión, todas las conductas de los 
animales se dan como respuestas reflejas a los estímulos externos. Descartes mo 
creía que los animales tuvieran libre albedrío mi que fueran capaces de acciones 
voluntarias y conscientes. El libre albedrío y la conducta voluntaria se considera- 
ban únicamente atributos de la conducta humana. Esta superioridad de los huma- 
nos sobre los animales existía porque se pensaba que sólo los seres humanos 
poseían mente y alma. La mente se consideraba como una entidad no física. Sin 
embargo, si la mente no es fisica, ¿cómo puede generar los movimientos físicos 
implicados en la conducta voluntaria? Descartes creía que la menre estaba conec- 
tada con el cuerpo físico a través de la glándula pineal, cercana al cerebro. Debido 
a su conexión con el cerebro, la mente podría ser consciente, y estar al tanto, de la 
conducta involuntaria. Á través de este mecanismo, la mente podría iniciar tam- 
bién acciones voluntarias. Coro la conducta voluntaria se iniciaba en la mente, se 
podría producir con independencia de la estimulación externa. 

De! dualismo mente-cuerpo introducido por Descartes parten dos tradiciones 
intelectuales. En una de ellas se discutía el contenido de la mente y su funciona- 
miento. Dado que la mente no se considera una entidad física, no es posible 
descubrir mediante disección, o realizando cualquier otro tipo de intervención 
orgánica, dónde está localizada la mente o cualquiera de sus características. Por 
tanto, el estudio de la mente se realizó a través del método de la introspección. 
Los pensadores implicados fueron más filósofos que científicos experimentales. 
Sin embargo, algunas de sus ideas fueron importantes para sentar las bases del 
estudio científico de la conducta humana. La segunda tradición intelectual está 
relacionada con los mecanismos de la conducta refleja. Dado que los reflejos son 
provocados totalmente por estímulos externos que actúan sobre los órganos cor- 
porales, el estudio de los reflejos se ha llevado a cabo usando los métodos de 
observación directa y experimentación. 


Mi 
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Hitos históricos en el estudio de la mente 


Como ya hemos señalado, una de las corrientes filosóficas se centraba en desa- 
rrollar hipótesis sobre el contenido de la mente y la forma en que ésta trabaja. Al 
pensar que la mente estaba conectada con el cerebro a' través de la glándula 
pineal, Descartes creía que parte del contenido de la mente procedía de las expe- 
riencias sensoriales. Sin embargo, también opinaba que algunos contenidos de la 
mente eran innatos y que existian en todos los seres humanos independiente- 
mente de su experiencia. Pensaba que todos los seres humanos nacían con ciertas 
ideas, incluyendo el concepto de Dios, el concepto de sí mismo y ciertos axiomas 
fundamentales de geometría (como el hecho de que la distancia más corta entre 
dos puntos es la línea recta). La corriente filosófica que postula que nacemos con 
ideas imnatas acerca de ciertas cosas se llama innatismo. 

TS filósofos posteriores a Descartes se opusieron a la posición innatísta. 

fo británico John Locke (1632-1704), por ejemplo, « creía que las personas 
aa todas sus ideas directa o indirectamente a través de la experiencia pos- 


terior al nacimiento. Pensaba que los seres humanos nacían totalmente ihócéntes, 


sin ideas preconcebidas sobre el mundo. Consideraba que la mente estaba al prin-. 
cipio en blanco (tabula rasa, en latín) y que sé ibá llenando progresivamente de 
ideas e información a medida que la persona iba pasando por diversas experien- 
clas sensoriales. Este modo de enfocar la cuestión del contenido de la mente se 
denomina empirismo. El empirismo fue aceptado por un grupo de filósofos bri- 
ránicos —conocidos como empiristas británicos— que vivieron entre los siglos 
XVII y XIX. 

Los filósofos innatistas y empiristas tenían puntos de vista ies no sólo 
en relación con lo que se suponía que contenía la mente, sino también en relación 
con la forma en que la mente operaba. Descartes pensaba que la mente no fun- 
cionaba de una forma predecible, metódica, y de acuerdo con unas leyes aún por 
descubrir. Uno de los primeros en proponer una alternativa a este punto de vista 
fue el filósofo británico Vhomas Hobbes (1588-1679). Hobbes aceptaba la distin- 
ción establecida por Descartés entre conducta voluntaria e involuntaria, y también 
aceptaba la idea de que la conducta voluntaria estaba controlada por la mente. Sin 
embargo, a diferencia de Descartes, creía que la mente operaba del mismo modo 
que los mecanismos reflejos: de forma predecible y obedeciendo unas leyes. Más 
concretamente, propuso que la búsqueda del placer y la evitación del dolo. gober- 
naban la conducta voluntaria. Así pues, las funciones de la mente no estaban 


determinadas. por. la razón, sino por el principio del hedonismo. La cuestión de 


que la búsqueda del placer y la evitación del dolor fueran actitudes o deseables no 
constituía un problema para Hobbes: El hedonismo era, simplemente, un hecho 
vital Como veremos, de una forma u otra esta concepción de la conducta ha 
pervivido en nosotros hasta hoy. 

Según los empiristas británicos, el concepto de asociación es otro de los 
aspectos importantes cuando se quiere conocer el funcionamiento de la mente. 
Recuérdese que el empirismo sostiene que todas las ideas se originan a partir de 


- las experiencias de los sentidos. Pero ¿de qué manera nuestras experiencias de los 


distintos colores, formas, olores y sonidos nos permiten llegar a ideas más com- 
plejas? Considérese, por ejemplo, el concepto de coche. El oír la palabra coche 
nos sugiere la idea de su aspecto, para qué se usa, y cómo nos sentiríamos al 


A 


"ra 
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montar en él. ¿Por qué el mero hecho de emitir el sonido de las letras c, o, ch, e 
rememora en nosotros tales ideas? Los empiristas británicos postulaban que las 
sensaciones simples formaban combinaciones de ideas más complejas por medio 
de asociaciones. El hecho de haber oído la palabra coche cuando uno vio un 
coche, cuando consideró la posibilidad de usar uno para el trabajo, o cuando se 
montó en uno, ha dado lugar al establecimiento de asociaciones entre la palabra 
cocbe y los distintos aspectos de los coches. Los empiristas británicos considera- 
ban tales: asociaciones muy importantes para explicar cómo trabaja la mente. 
Dedicaron un esfuerzo considerable a detallar las reglas de las asocaciones, 

Los empiristas británicos aceptaron dos conjuntos de reglas para el estableci- 
miento de asociaciones, unas primarias y otras secundarias. Las reglas primarias 
fueron establecidas originariamente por el filósofo griego Aristóteles. Este pos- 
tuló tres principios para el establecimiento de asociaciones: contigiitdad, seme- 
janza y contraste. De ellos, el principio de contigúidad ha sido considerado el más 
importante para las asociaciones. Este principio establece que si dos hechos ocu- 
rren juntos de forma repetida llegan a asociarse. Una vez que se ha establecido 
esta asociación, la aparición de uno de los acontecimientos evocará la memoriía del 
otro. Los principios de semejanza y contraste establecen que dos cosas llegan a 
asociarse si son sernejantes en algún sentido o tienen algunas características que 
contrasten (por ejemplo, una persona exageradamente alta y una persona exape- 
radamente baja). Las distintas leyes secundarias de las asociaciones fueron expues- 
tas por los filósofos empiristas. Thomas Brown, por ejemplo, postuló que hay 
ciertos factores que influyen en la formación de las asociaciones, entre los que se 
incluyen la intensidad de las sensaciones y lo frecuente y reciente que sea su 
aparición. Se pensaba, además, que la asociación de un hecho con otro dependía 
del número de asociaciones en las que cada hecho había estado implicado ante- 
riormente, y la similitud de estas asociaciones pasadas con la que en ese momento 
se estaba formando. 

Los empiristas británicos discutían las reglas de las asociaciones coro parte de 
su discurso filosófico. Pero no realizaron experimentos para determinar qué 
reglas eran correctas y cuáles incorrectas, o las circunstancias en que una regla era 
más importante que otra. La investigación empírica acerca de los mecanismos, de 
las asociaciones se inició con los trabajos pioneros del psicólogo alemán del si- 
gloxIx Hermann Ebbinghaus (1850-1909). Ebbinghaus inventó las sílabas sin 
sentido para utilizarlas en.sus experimentos. Las sílabas sin sentido eran combi- 
naciones de tres letras (una consonante seguida de una vocal y otra consonante) 
sin significado, para que la forma en que eran aprendidas no pudiera verse 
influida por su significado. Ebbinghaus se presentó a sí mismo listas de sílabas sin 
sentido y midió su capacidad de recordar las sílabas bajo distintas condiciones 
experimentales. Con este método general pudo responder experimentalmente a 
cuestiones tales como la forma en que la fuerza de una asociación mejora cuando 
aumenta el entrenamiento, si las sílabas que aparecen juntas en una lista están 
más fuertemente asociadas entre sí que las sílabas muy separadas, y si una sílaba 
se asocia más fuertemente con la siguiente en la lista que con la anterior. 
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Hitos históricos en el estudio de los reflejos 


El concepto de acto reflejo, introducido por Descartes, hizo avanzar significa- 
tivamente nuestra comprensión de la conducta. Sin embargo, era equivocada la 
idea de Descartes sobre la formación de los reflejos. Creía que los mensajes senso- 
riales que iban a la mente y los mensajes motores que iban a los músculos viaja- 
ban por los mismos nervios. También pensaba que los nervios eran tubos huecos 
y que la glándula pineal liberaba sustancias llamadas «humores» que fluían por 
estos tubos y penetraban en los músculos haciendo que se hincharan y creando 
movimiento. Por último, Descartes consideraba que todos los movimientos refle- 
Jos eran inmatos y que venían determinados por la anatomía del organismo. 

Las observaciones experimentales posteriores a Descartes mostraron que 
estaba equivocado acerca de la anatomía de los reflejos y los mecanismos de con- 
ducción neuronal. Estas investigaciones indicaron también que no todas las res- 
puestas reflejas son innatas. La anatomía del arco reflejo fue establecida en los 
experimentos realizados por Chátles Bell (1774-1842) en Inglaterra y Erangois 
Magendie (1/83-1855) en Francia. Descubrieron que los nervios que intervienen 
en la trasmisión dé la información sensorial desde los órganos de los sentidos 
hasta el sistema nérvioso central, y los que conducen la información motora desde 
éste hasta los músculos, son diferentes. Si se corta un nervio sensorial, el animal 
mantiene su capacidad de realizar movimientos musculares, y si se corta un ner- 
vio motor, el animal sigue siendo capaz de registrar la información sensorial. 
Para establecer el mecanismo de conducción neuronal se requería una experimen- 
tación mucho más extensa. La idea de que los humores estuvieran implicados en 
la trasmisión neuronal fue refutada inmediatamente después de la muerte de Des- 
cartes. En 1669 Swammerdam (1637-1680) mostró que la excitación mecánica de 
un nervio es suficiente para producir una contracción muscular, Así pues, no es 
necesaria la difusión de «humores» desde la glándula pineal. En otros estudios, 
Francis Glisson (1597-1677) demostró que no se producían contracciones museula- 
res al hinchar un músculo por infusión de algún tipo de fluido, como pensaba 
Descartes. Glisson hacía que la gente sumergiera un brazo en agua y observaba 
que el nivel del agua no cambiaba cuando se les pedía que contrajeran un músculo. 
Tales experimentos indicaban que la conducción neuronal no se producía por los 
mecanismos que proponía Descartes. Sin embargo, hubo que esperar al siglo XIX 
y sus grandes avances en el conocimiento de la electricidad y la química para 
conocer los verdaderos mecanismos. De acuerdo con el pensamiento contemporá- 
neo, en la conducción neuronal intervienen fenómenos químicos y eléctricos. 

En el siglo XIx, la mejor comprensión de los procesos fisiológicos responsa- 
bles de la conducta refleja estuvo acompañada por una liberalización del restrin- 
gido papel de los reflejos en la explicación de la conducta. Descartes y la mayoría 
de los filósofos que le siguieron suponían que los reflejos sólo eran responsables 
de las reacciones simples a los estímulos. Se pensaba que la energía de un estí-. 
mulo era transformada directamente (reflejada) en energía de la respuesta elici- 
tada por las conexiones neuronales. Cuanto más intenso era el estímulo, más 
fuerte sería la respuesta resultante. Este punto de vista sobre los reflejos es con- 
gruente con muchas observaciones casuales, Si tocamos un horno, cuanto más 
caliente esté más rápidamente retiraremos la mano. Sin embargo, los reflejos 
pueden llegar a ser más complicados. 
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Dos psicólogos rusos, Sechenov (1829-1905) y Pavlov (1849-1936), fueron los Charles. Darwin y el concepto de evolución 

principales responsables de que el concepto de reflejo se ampliara para explicar Lo edad da Oo 
conductas más complejas. Sechenov postuló que en algunos casos el efecto de un Otro antecedente muy importante en el estudio de da E os in (1809 

estímulo no consiste en provocar una conducta refleja. Antes bien, lo que ocurre describir es el trabajo del biólogo británico del siglo XIX Charles e eno 
es que un estímulo puede liberar una respuesta que estaba inhibida. Las respues- 1882). Darwin quería saber porque las distintas especies y subespecies de o 
tas sexuales, por ejemplo, se suprimen en la mayoría de las situaciones sociales. El les tenian diferentes características. Basándose en extensas observaciones de ife- 
estímulo del dormitorio privado puede hacer que los amantes emitan esas res- rentes tipos de animales, formuló su teoría de la evolución. Pudo apreciar que 
puestas. Con este tipo de mecanismo, la intensidad de un estímulo no se trans- cada miembro de una especie es ligeramente diferente de los Otros miembros. 
forma necesariamente en intensidad de la respuesta elicitada. En nuestro ejemplo, ! Esas variaciones individuales, pensó, ocurrían de forma aleatoria mediante proce- 
no es la vivacidad de los estímulos de la habitación propia la que determina el sos no específicos. Algunos conejos, por ejemplo, pueden correr más deprisa que 
vigor de la conducta sexual. Simplemente, la conducta sexual es liberada de su otros, y algunos pájaros tienen mejor vista que otros. Puede que estos individuos, 
inhibición por las claves del dormitorio, y lo apasionado de la conducta depende gracias a tales características, tengan más probabilidades de sobrevivir que aque- 
de otros factores como el tiempo transcurrido desde la última vez que estuvieron llos que no las poseen. La capacidad de correr deprisa ayuda a los conejos a esca- 
juntos. Si la intensidad de un estímulo no determina en todos-los casos la fuerza par de los depredadores, y una vista excepcionalmente buena permite a los pája- 
de la respuesta provocada, entonces es posible que un estímulo débil produzca una ros detectar comida a larga distancia. Aquellos individuos cuyas destrezas se 
respuesta fuerte. Sechenov aprovechó este tipo de mecanismos para proporcionar adaptan mejor a los desafíos que la naturaleza les plantea tienen más probabilida- 


un análisis reflejo de la conducta voluntaria. Sugirió que las formas complejas de 
conducta (acciones O pensamientos) que aparecen en ausencia de un estímulo 
elicitante obvio son, de hecho, respuestas reflejas. Lo que ocurre en estos casos es 
simplemente que los estímulos elicitantes son tan débiles que no los advertimos. 
Así pues, según Sechenov, la conducta y los pensamientos voluntarios están real- 
mente elicitados por estímulos débiles que mos pasan imadvertidos. 

Las ideas de Sechenov acerca de la conducta voluntaria representan la exten- 
sión máxima del uso de los mecanismos reflejos para explicar diversos aspectos 
de la conducta. Sin embargo, su proposición fue una extrapolación filosófica de los 
resultados concretos que obtenía de las investigaciones. Además, Sechenov no se 
planteó esta cuestión: cómo pueden los mecanismos reflejos explicar el hecho de 
que la conducta de amimales y personas cambie constantemente de acuerdo con 


des de sobrevivir y trasmitir esas características a sus descendientes. Ese proceso 
se repite una y otra vez con el paso de las generaciones, dando como resultado 
que cada vez sean más los miembros de un grupo de animales que poseen rasgos 
particulares que facilitan la supervivencia en su ambiente. Éste proceso se llama 
evolución mediante selección natural. a 

” Gracias al proceso evolutivo puede que, después de muchas generaciones, un 
conjunto de organismos tenga descendientes que se parecen muy poco a sus 
ancestros. Darwin afirmó que la evolución era la responsable de la aparición de 
nuevas especies, y no vio razón para que las características especificamente 
humanas no pudieran haberse desarrollado de igual manera a partir de otra clase 
de organismos. Creyó en la continuidad de las especies, incluida la humana. Nin- 


sus experiencias. Desde Descartes, pasando por Sechenov, las respuestas reflejas : guna especie se consideraba O o a A a 
se han considerado innatas, determinadas por la anatomía del sistema nevioso del puede que 558 POsMcnor en el curso de la evolución. Esta COPIA A a con E 
organismo. $e pensaba que dependían de la conexión neuronal establecida de : de las especies ofrece e razón de peso para el estudio con or io OLA 
antemano entre los órganos de los sentidos y los músculos relacionados con ellos. de aumentar el conocimiento sobre los seres humanos. Si, € MESHO, E o 
Según este punto de vista, es de esperar que un estímulo concreto elicite la misma humanos proceden de otras formas animales, entonces la información enrenioa:a 
respuesta a lo largo de la vida del organismo. Aunque esto es verdad en algunos ] partir de los animales puede muy bien servir para proporcionar información 
casos, también se dan muchos ejemplos en los que cambia la respuesta ante un : - Importante sobre la naturaleza humana. : : 

mismo estímulo. Para explicar esos casos a través de procesos reflejos hubo que - Las observaciones científicas de Darwin tenían tanto que ver con las caracte- 
esperar al trabajo de Iván Pavlov. Pavlov mostró experimentalmente que no rísticas comportamentales de los animales como con sus rasgos físicos. Darwin no 
todos los reflejos son innatos. Á través de los mecanismos de asociación se pue- limitó su teoría de la evolución a la explicación de características físicas. Conside- 
den establecer nuevos reflejos a los estímulos. El papel de Pavlov en la historia raba que las características conductuales, las expresiones emocionales y la inteli- 
del estudio de los reflejos es comparable al papel de Ebbinghaus en el estudio de | gencia pueden evolucionar del mismo modo que lo hacen los rasgos físicos. Si esta 
la mente. Los dos se preocuparon por establecer las leyes de las asociaciones a | | suposición es cierta, entonces una investigación detallada sobre la conducta ani- 
través de la investigación empírica. | L mal debería ser fundamental para la comprensión de la conducta humana. 


El enfoque conductual en su contexto histórico 


El enfoque conductual del estudio de la psicología puede ser considerado como 
la versión moderna del estudio de los reflejos comenzado por Descartes. El enfo- 
que conductual utiliza los métodos de observación científica, se centra en aspectos 
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de la conducta causados por acontecimientos ambientales, y se dedica al estudio de 
pequeñas unidades de conducta antes que a la investigación de procesos psicológi- 
cos complejos. Sin embargo, el enfoque conductual no está totalmente enraizado 
en la tradición reflexológica. Algunos de sus aspectos pueden ser encontrados en 
los primeros debates filosóficos acerca de la mente. En el siglo XX, la controversia 
innatismo-empirismo, por ejemplo, ha tenido su contrapartida en el desarrollo de 
la psicología conductual. El primer y más notable defensor del enfoque conductual 
fue el psicólogo americano John B. Watson (1878-1958), que creía-que.la conducta 
era tusiilimitadamente maleable por la “experiencia. Dijo una vez, con una frase 
que se “ha hecho famosa: 


Dadme una docena de niños sanos, bien formados, y, para criarlos, un mundo como yo | 


especifique, y garantizo que cogeré uno al azar y le adiestraré para convertirle en un especia- 
lista del campo que yo seleccione —médico, abogado, artista, jefe de ventas y sí, incluso, un 
ladrón o un mendigo—, con independencia de sus talentos, predilecciones, tendencias, capact- 
dades, vocaciones y raza de sus antepasados (Watson, 1924, pág. 104). 


Watson reconocía que su frase era una exageración. Sin embargo, la idea de 
que la conducta es altamente maleable puede considerarse análoga al empirismo 
defendido por Locke en el siglo xvI1. Como veremos en los siguientes capítulos, 
las investigaciones actuales sobre conducta son mucho más respetuosas con el 
hecho de que los organismos nacen con fuertes tendencias innatas. Hoy día es 
ampliamente aceptado que lo que los organismos aprenden mediante la experien- 
cia está limitado por las características conductuales heredadas. Así pues, las 
investigaciones actuales sobre la conducta tienen un sabor más innatista. 

Otras semejanzas del enfoque conductual con anteriores discusiones filosóficas 
sobre la mente se pueden encontrar en el concepto de hedonismo, y en la enorme 
importancia que aquéllas otorgaban a las asociaciones. para explicar la conducta, 
En el siglo xvH, Hobbes postuló que la mente trabaja para lograr el placer y 
evitar el dolor. Muchas investigaciones contemporáneas pueden considerarse aná- 
lisis experimentales sobre el papel del placer y el dolor en el control de la con- 
ducta (véase capítulos 5 a 10). El concepto de asociación ha tenido aun mayor 
influencta en las investigaciones sobre la conducta. La mayoría de los experimen- 
tos llevados a cabo en el marco del enfoque conductual se han interesado de una 
forma u otra por el papel de las asociaciones en el control de la conducta. 

Por último, el enfoque conductual ha estado muy influido por las ideas de 
Charles Darwin y el concepto de evolución. Gran parte de las investigaciones 
realizadas dentro de la tradición conductual han utilizado sujetos animales. 
Muchos de estos experimentos no se habrían podido hacer si los investigadores 
no hubiesen creído que el estudio de la conducta animal proprociona un conoci- 
miento significativo de la conducta humana. Esta opinión no se mantiene hoy en 


día tan fervientemente como antes de 1970. Sin embargo, todavía muchos expe-- 


rimentos animales se realizan con la intención de desarrollar modelos y teorías 
que se pueden aplicar también a la conducta humana. El concepto de evolución es 
también importante porque ha vuelto a los investigadores sensibles ante el hecho 
de que la conducta, en una situación concreta, está determinada no sólo por los 
estímulos con. los que se encuentra el animal, sino también por las tendencias 
conductuales heredadas. 
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EL APRENDIZAJE Y EL ESTUDIO DE LA CONDUCTA 


El enfoque conductual se ha aplicado al estudio de una gran variedad de aspec- 
tos de la psicología, entre los que se incluyen la conducta normal, el habla la 
personalidad. Sin embargo, se ha usado más ampliamente en el estudio de los 
mecanismos de aprendizaje y condicionamiento, y es en estos aspectos del enfo- 
que conductual en los que el libro se centrará. 

El aprendizaje es uno de los procesos biológicos cruciales para la superviven- 
cia de muchas formas de vida animal, La integridad de la vida depende de distin- 
tas funciones biológicas. Los animales tienen que tomar alimentos, eliminar los 
desechos del metabolismo y, por otra parte, mantener el equilibrio adecuado de 
las funciones internas. Mediante la evolución se han generado gran variedad de 
Sistemas biológicos para realizar estas tareas. Muchos de estos sistemas son fisio- 
lógicamente primarios, como los implicados en la respiración, digestión y excre- 
ción. Sin embargo, los procesos fisiológicos internos, perfectamente armonizados 
a menudo no bastan para mantener la integridad de la vida. Los animales y las 
personas vivimos en ambientes que están en constante transformación por los 
cambios climáticos, cambios en los recursos alimenticios, la llegada y partida de 
depredadores, y otros. Los efectos adversos de estos cambios a. menudo son mini- 
mizados mediante ajustes conductuales. Los animales tienen que saber, por ejem- 
plo, cómo encontrar y obtener comida cuando cambian los recursos alimenticios 
cómo evitar a los depredadores cuando entran en su territorio, y cómo encontrar 
nuevas guaridas cuando las tormentas destruyen sus hogares. Lograr estas tareas 
requiere, obviamente, movimientos motores tales como andar y manipular obje- 
tos. Dichas tareas también requieren la capacidad de predecir acontecimientos 
importantes del entorno ambiental, como la disponibilidad de comida en un lugar 
y Un momento concretos. La adquisición de una conducta motora nueva y de 
nuevas reacciones anticipatorias implica aprendizaje. Por tanto, los animales 
aprenden 2 1 4 una poza nueva cuando la vieja se seca, y aparecen conductas 
anticiparorias nuevas cuando aparecen nuevas fuentes de peligro. Estos reajustes 
aprendidos ante el ambiente no son menos importantes para la supervivencia que 
los procesos fisiológicos internos, como la respiración y la digestión. 


Definición de aprendizaje 
ue 


, . ro“. po 
La mayoría de la gente asocia automáticamente eÑaprendizaje con la adquisi- 


ción de una conducta nueva. Es decir, el aprendizaje se identifica por la aparición 


de una nuéva respuesta en el repertorio del organismo. Tal es el caso de la gente 
que aprende a leer, a montar en bicicleta o a tocar un instrumento. Sin embargo 

. . - . . ? 
el cambio de conducta implicado en el aprendizaje puede también consistir en la 


- disminución o pérdida de una conducta del repertorio del organismo. Por ejemn- 


plo, un niño puede'2prender a no cruzar la calle cuáatido está el semáforo en rojo 
: , 


¿A NO CO ¡ ¡ chi 

y? no coger comida del plato de otro, o a no hacer ruido ni chillar cuando alguien 
.. + está intentando echarse una siesta. Aprender a contener respuestas es tan impor- 

. fante como aprender a dar respuestas, si no más. 


A menudo pensamos en el aprendizaje como un proceso. complejo que 
requiere una práctica especializada, y que da lugar a formas de conducta sofistica- 
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das y llamativas. Hay muchos ejemplos de este tipo de aprendizaje. Aprender 


cálculo, patinaje artístico, natación de competición o una lengua extranjera con- 
lleva una extensa práctica especializada y capacita a la persona para actuar de una 
forma que resulta sorprendente para todos aquellos que carecen de esas habilida- 
des. Pero hay sistemas de respuestas mucho más simples en los que el aprendizaje 
también está involucrado. Los investigadores del apendizaje han dedicado gran 
parte de su esfuerzo a estudiar los mecanismos de aprendizaje de sistemas de 
respuesta simples, con la esperanza de que el conocimiento obtenido de tales 
investigaciones les lleve a la formulación de principios generales de aprendizaje. 
También se espera que la investigación de sistemas de respuesta simples propor- 
cione la información básica necesaria para el estudio de forrmmas más complejas de 
aprendizaje. 

No existe una definición del aprendizaje aceptada universalmente. Sin embar- 
go, muchos aspectos esenciales del concepto de aprendizaje vienen recogidos en la y 


; Siguiente frase: :el úprendizaje es un cambio duradero en los mecanismos de con- Í, 
: ducta, resultado de Ta expériencia con los acontecimientos ambientales. Son |' 


importantes varios aspectos de esta definición. Primero, se dice que el aprendizaje 
es un cambio en los mecanismos de la conducta, no un cambio en la conducta 
misma. ¿Por qué definimos el aprendizaje como un cambio en los mecanismos de 
la conducta? La razón principal es que la conducta está determinada por muchos 
factores además del aprendizaje. Piénsese, por ejemplo, en el acto de comer. Uno 
come algo según el hambre que tenga, el esfuerzo que haya que realizar para 
conseguir la comida, lo que le guste la comida, y si sabe o no dónde está, De todos 
estos factores sólo el último implica necesariamente aprendizaje. Este ejemplo 

Por actuación nos referimos a las acciones de un organismo en un momento 
concreto. Que in organismo haga una cosa u otra (su actuación) depende de 
muchas cosas. Incluso la realización de una respuesta simple, como empujar un 
carrito de la compra por un pasillo, está determinada por multitud de factores. 
Que uno dé o no esta respuesta depende de que haya un carrito disponible, de la 
motivación que uno tenga para usar un carrito, de la habilidad para sujetar el 
carrito, de la capacidad física para empujarlo, de la capacidad para ver lo que hay 
delante del carro, y del conocimiento aprendido sobre cómo funcionan los carritos : 
de la compra. La actuación está determinada por la oportunidad, la motivación y 
las capacidades sensoriales y motoras, además de por el aprendizaje. Por tanto, no 
puede considerarse automáticamente que un cambio en la actuación refleje 
aprendizaje. 

La definición enunciada arriba identifica el aprendizaje como un cambio en 
los mecanismos de conducta para hacer hincapié en la distinción entre aprendi- 
zaje y actuación. Sin embargo, los investigadores no pueden observar directa- 
mente estos mecanismos. Lo que ocurre es que a partir de cambios en la conducta 


"se infiere un cambio en los mecanismos de conducta. Así pues, la conducta de un 


organismo (su actuación) se usa para proporcionat pruebas de que existe aprendi- 
zaje. Sin embargo, debido a que la actuación está determinada por muchos facto- 
res aparte del aprendizaje, se debe tener mucho cuidado al decidir si un aspecto 
concreto de la actuación refleja o no refleja aprendizaje. Á veces no se pueden 
tener pruebas de que ha habido aprendizaje hasta que se establecen procedimien- 
tos con tests especiales. Por ejemplo, los niños aprenden mucho sobre la conduc- 


all 
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ción de-un coche simplemente viendo a otros conducir, pero este aprendizaje no 
se hace evidente hasta que se les permite ponerse al volante. En otros casos 
(véase más abajo) se observa en seguida un cambio en la conducta pero no puede 
atribuirse al aprendizaje, bien porque no dura lo suficiente, bien porque no es 
producto de la experiencia con los acontecimientos ambientales. 


t 


Distinción entre el aprendizaje y otras causas de cambio en la conducta 


Puede resultar difícil evaluar distintas situaciones en función de la definición 
abstracta de aprendizaje que se dio arriba, porque algunos aspectos de esta defini- 
ción son bastante imprecisos. No se especifica exactamente cuánto tienen que 
durar los cambios conductuales para ser considerados casos de aprendizaje. A 
veces también es difícil decidir qué constituye suficiente experiencia con los acon- 
tecimientos ambientales como para clasificar algo como un caso de aprendizaje. 
Por tanto, es útil distinguir el aprendizaje de otros mecanismos conocidos que 
pueden producir cambios en la conducta. 
Numerosos mecanismos producen cambios en la conducta que son muy poco 
duraderos para ser considerados casos de aprendizaje. Uno de esos procesos es la 
* fatiga. El esfuerzo físico puede provocar un debilitamiento gradual de la intensi- 
dad de la respuesta porque el sujeto se cansa o fatiga. Este tipo de cambio es 

_ Producto de la experiencia. Sin embargo, no se considera como un caso de apren- 

_dizaje, porque el declive en la respuesta desaparece si al sujeto se le permite 
descansar y recuperarse. La conducta puede ser también alterada temporalmente 
por un cambio en las condiciones estimulares. Por ejemplo, si se libera repenti- 
namente a unos pájaros que han sido"encerrados en una jaula pequeña, su con- 
ducta cambiará drásticamente. Sin embargo, éste no es un caso de aprendizaje 
porque probablemente los pájaros volverán a responder como lo hacían si se les 
devuelve a su jaula. Otra fuente de cambios temporales en la conducta que no se 
considera aprendizaje es la alteración en el estado motivacional o fisiológico del 
organismo. EKhambre y lá sed'inducen respuestas que no se observan en otros 
momentos. Cambios en el nivel de las hormonas sexuales causarán cambios tem- 
porales en la sensibilidad a miembros del otro sexo. La administración de drogas 
psicoactivas también puede estar acompañada de efectos conductuales de corta 
duración. 

Hay otros mecanismos que producen cambios permanentes en la conducta 
pero sin que exista el tipo de experiencia con los acontecimientos ambientales que 
especifica la definición de aprendizaje. El más obvio proceso de este tipo es la 


maduración. Un niño no podrá alcanzar un estante alto hasta que crezca lo sufi- 


ciente. Sin embargo, en este caso el cambio en la conducta no se considera un 
ejemplo de aprendizaje, porque es producto del mero paso del tiempo. Cuando 
uno se hace más alto no tiene por qué ser adiestrado para alcanzar lugares eleva- 
dos. La maduración también puede dar lugar a la pérdida de ciertas respuestas. 
Por ejemplo, poco después del nacimiento, al tocar los pies del bebé provocamos 
movimientos del pie similares a los de caminar. Y al dar un golpecito en las 
plantas de los pies, los dedos se abren en abanico. Estas dos reacciones reflejas se 
pierden cuando el bebé crece. 

Generalmente, la diferencia entre aprendizaje y maduración está basada en la 
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importancia que tienen ciertas experiencias para producir un cambio en la con- 
ducta. Sin embargo, esta distinción sé hace imprecisa en los casos en que se ha 
encontrado que la exposición a estímulos es necesaria para cambios evolutivos 
que originalmente se pensó que dependían únicamente de la maduración al mar- 
gen de la experiencia. Por ejemplo, la capacidad de percibir lineas horizontales 
del sistema visual de los gatos mo se desarrollará lo suficiente a menos que sean 
expuestos a tales estímulos en una edad temprana (véase, por ejemplo, Blake- 
more y Cooper, 1970). También se pensó que la aparición de conducta sexual 
durante la pubertad dependía de la maduración. Sin embargo, los experimentos 
¿sugieren que el éxito en la:Conducta_ sexual podría requerir un contacto social 
temprano (por ejemplo, Harlow, 1969). 

Hasta aquí hemos discutido los mecanismos que provocan cambios en la con- 
ducta durante la vida del organismo. Los cambios en la conducta también pueden 
aparecer a través del paso de generaciones por medio de lazadaptación evolutiva. 
Los individuos que poseen características genéticas que facilitan su reproducción 
probablemente trasmitirán estas características a las futuras generaciones. La 
adaptación y el cambio evolutivo producidos por el éxito reproductivo diferencial 
pueden llevar a cambios en la conducta al igual que llevan a cambios en las carac- 
terísticas físicas de las especies. Los cambios evolutivos son similares al aprendi- 
zaje en el sentido de que también están relacionados con influencias ambientales. 
Las características de los individuos que facilitan su éxito reproductivo dependen 

“del medio en el que vivan. Sin embargo, los cambios evolutivos aparecen sólo 
después de generaciones y por tanto deben ser distinguidos del aprendizaje (véase 
Plotkin y Odling-Smee, 1979, para una discusión de la relación entre aprendizaje 
y evolución). 

Aunque el aprendizaje se distinga de la maduración y la evolución, no es 
independiente de estas otras fuentes de cambio conductual. La aparición de un 
proceso concreto de aprendizaje, o cómo este opere, depende del nivel de madura- 
" ción del sujeto y de su historia evolutiva, La dependencia del aprendizaje respecto 
a la maduración se hace obvia en ciértos Aspectos de la crianza de los niños. Por 
ejemplo, por mucho que se entrene a un niño a controlar sus esfínteres, este 
entrenamiento no será eficaz hasta que los músculos y nervios se hayan desarro- 
llado lo suficiente para hacer posible este control. Al comparar los procesos de 
aprendizaje en distintos tipos de animales se puede apreciar la dependencia del 
aprendizaje respecto a la historia evolutiva. Por ejemplo, en situaciones del condi- 
cionamiento instrumental parece que los peces y las tortugas aprenden de forma 
diferente que las ratas y los monos (Bitterman, 1975). En capítulos posteriores se 
abundará en la idea de interacción entre historia evolutiva y aprendizaje. 


EL USO DE ANIMALES EN LAS INVESTIGACIONES SOBRE 
APRENDIZAJE 


El estudio del aprendizaje se puede realizar investigando la conducta tanto de 
seres humanos como de otros animales. El estudio científico de la conducta no se 
restringe a uma parte concreta del reino animal. Sin embargo, la mayoría de los 
experimentos que consideraremos se han llevado a cabo con animales no huma- 
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nos. Se han utilizado gran variedad de animales, tanto ratas como ratones, cone- 
jos, peces, palomas y monos. 

Ventajas prácticas del uso de antmales 


Al usar animales.en.vez de humanos en la investigación sobre aprendizaje 
encontramos varias. Nentajas. Importantes, muchas de las cuales resuelven proble- 


“mas pr cticos que aparecen en la investigación. Es mucho más fácil controlar la 


experiencia pasada de los animales que la de las personas. Situar a seres “humanos 


Ln 


“én medios totalmente controlados plantearía bastantes” problemas éticos. Ar pesar 


de que los animales de laboratorio están por lo general muchó mejor cuidados que 
los animales en libertad, el desarrollo de investigaciones con animales también 
presenta importantes restricciones éticas. Se pueden diseñar fácilmente ambientes 
de laboratorio en que muchas de las cosas que los animales experimentan están 
altamente reguladas, sin por ello imponer el grado de dureza que los animales 
tienen que soportar cuando están en libertad. 

Otra ventaja práctica. del estudio. con animales en el laboratorio es que se . 
puede: controlar. la historia genética de. los. sujetos, lo cual hace mucho más fácil 
que con humanos la evaluación de la contribución de los factores genéticos a la 
conducta. El uso de animales también hace más fácil el control de la situación 
experimental. Las cámaras experimentales pueden ser más pequeñas y no necesi- 
tan tan costosas comodidades como alfombras y mobiliario, También se puede 
someter a animales a procedimientos tales como la privación de agua y comida 
con muchos menos problemas de los que acarrearía hacerlo con seres humanos. 
Por últime, como los animales difícilmente deciden si quieren participar en un 
experimento, las investigaciones, no. sé limiran-a- individuos voluntarios, y-por” 
tanto es más probable que.los.sujeros de experimentos con animales sean repre-. 
Sentativos “de sus especies. Con frecuencia las investigaciones con humanos se 


“timitan, por consideraciones éticas, a aquellos individuos que deciden voluntaria- 


mente participar en el experimento. Para algunas clases de estudios (por ejemplo, 
los que requieren gran cantidad de tiempo o esfuerzo, o incluyen algún tipo de 
estimulación aversiva), las personas que se presentan voluntarias pueden no ser 
representativas de toda la especie humana. 


Ventajas conceptuales del uso de antmales 


Además de las consideraciones. prácticas, el uso de animales en el estudio de la 
conducta tiene, posiblemente,. xentajas conceptuales. Existe la esperanza de que 
los procesos de aprendizaje sean más simples en animales criados en situaciones 
controladas de laboratorio que en las personas, cuya educación es mucho más 
variada. De momento, no se conocen todos aquellos aspectos en los que el apren- 
dizaje en animales es más simple que en humanos. Sin embargo, existe acuerdo 
en que la conducta animal no presenta las complicaciones de los procesos lingiís- 
ticos, qué tienen un papel. relevante en ciertos. tipos de conducta humana. En la 
investigación U contemporánea, una de las áreas más apasionantes es el estudio de 
las capacidades lingiiísticas de los primates (véase capítulo 12). Sin embargo, no 
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existen pruebas de que los procesos de aprendizaje del tipo que vamos a discutir 
en la mayor parte de este libro impliquen funciones limgúísticas. 

Otra ventaja importante del uso de animales es que no hay que preocuparse 
del cumplimiento de las características del experimento. En muchas formas de 
investigación con personas uno debe asegurarse de que las acciones de éstas no 
están regidas por las ganas de agradar o desagradar al experimentador. A, 
menudo, la gente que se presta a los experimentos trata de adivinar cuál es el 
propósito del estudio y qué es lo que «se supone» que tienen que hacer. Tanto si 
identifican correctamente el propósito del experímento como sino, sus acciones 
pueden estar motivadas por su deseo de «hacerlo bien» más que por los estímulos 
y las condiciones experimentales que se habían establecido. Por tanto, una per- 
soma puede reaccionar ante las circunstancias del laboratorio de forma muy dis- 
tinta a la que emplearía en las mismas circunstancias fuera del laboratorio. En 
investigaciones con animales, tales como ratas y palomas, no es probable que 
surjan estos problemas. No hay razón para pensar que las acciones de las ratas y 
las palomas en el laboratorio estén determinadas por su deseo de complacer al 
experimentador, o hacerlo bien en el experimento, y así evitar sentirse violento. 


Los ansmales de laboratorio y la conducta normal 


Hay quien sugiere que las cepas de animales de laboratorio domesticados 
podrían proporcionar una información poco útil, ya que tales animales han dege- 
nerado en varios sentidos como resultado de muchas generaciones de endogamia 
y largos períodos de cautividad (por ejemplo, Lockard, 1968). Sin embargo, esta 
idea es, probablemente, errónea. Boice (1977) realizó una prueba interesante, en 
la que tomó cinco machos y cinco hembras de ratas albinas de una cepa de labora- 
torio con alta endogamia y las colocó en un recinto al aire libre, en Missouri. Las 
diez ratas sobrevivieron al primer invierno con temperaturas que descendieron 
hasta —19* C. Los animales se reprodujeron con normalidad y alcanzaron una 
población estable de unos 50 miembros. Durante un período de dos años, sólo 
tres de las ratas murieron antes de mostrar signos de vejez. Considerando las 
extremas condiciones climáticas es destacable el éxito alcanzado en la superviven- 
cia al altre libre. Más aún, la conducta de estas ratas domesticadas en el exterior 
fue muy similar a la conducta observada con ratas salvajes en circunstancias 
similares. 

La resistencia de las ratas de laboratorio con un historial de alta endogamia e en 
condiciones de vida al aire libre indica que no son inferiores a sus compañeras 
salvajes. Las ratas domesticadas también se comportan de forma similar a las 
salvajes en otras circunstancias, y existen pruebas de que actúan mejor que las 
_Aatas salvajes en los experimentos sobre aprendizaje (por ejemplo, véase Boice, 
71973, 1981; Kaufman y Collier, 1983). Por tanto, los resultados que describimos 
en este libro no deben ser rechazados por el simple hecho de que muchos de los 
experimentos fueron realizados con animales domesticados. De hecho, se puede 
afirmar que los animales de laboratorio son preferibles en investigación a sus 
equivalentes salvajes. En las sociedades civilizadas, los seres humanos viven y 
crecen en ambientes de alguna forma artificiales. Por tanto, la investigación con 
animales podría resultar más aplicable a los seres humanos si los animales están 
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domesticados y viven en situaciones artificiales de laboratorio. Como ha comen- 
tado Boice (1973, pág. 227), «la rata domesticada puede ser un buen modelo del 
hombre doméstico». 


Generalización de los resultados del aprendizaje animal 


Una de las características más sobresalientes de los animales es su diversidad. 
Unos animales son grandes, otros pequeños; unos viven en el agua, otros en la 
tierra; unos prefieren los lugares húmedos, otros los secos; algunos constan sólo 
de unas pocas células, otros son complejos organismos multicelulares; unos tienen 
simplemente un rudimentario sistema nervioso, otros tienen un complejo sistema 
nervioso, altamente organizado. Casi todos los investigadores centran sus esfuer- 
zos en un pequeño número de especies, o incluso sólo en una. ¿Hasta qué punto 
sus hallazgos serán aplicables a otras especies? Las distintas especies de animales 
difieren en los movimientos motores que son capaces de efectuar, y en los tipos 
de estímulos que son capaces de detectar. Estas diferencias en la capacidad motora 
y sensorial representarán diferencias en lo que las distintas especies pueden 
aprender. Por ejemplo, un perro puede aprender fácilmente a subir escaleras, 
pero no hay entrenamiento que enseñe a hacer lo mismo a un pez. Las diferencias 
en capacidad motora y sensorial dan lugar a diferencias en la capacidad de apren- 
dizaje de las distintas especies, esto es, diferencias en el contenido del aprendizaje. 
Sin embargo, las diferencias en el contenido del aprendizaje no implican necesa- 
riamente que los mecanismos y principios del aprendizaje sean diferentes. 

A menudo los mismos mecanismos o principios de aprendizaje pueden utili- 
zarse para aprender diferentes contenidos. Considérese, por ejemplo, el aprendi- 
zaje de información en un curso de sociología y en un curso de psicología. Á pesar 
de las diferencias en los contenidos a aprender, se pueden usar las mismas técni- 
cas de aprendizaje: primero tener:una visión de conjunto del capítulo, elaborar 
cuestiones sobre él, leerlo y repasarlo. De forma similar, el aprendizaje de res- 
puestas diferentes ante diferentes estímulos, en distintas especies de animales, 
puede implicar los mismos mecanismos, y principios similares entre sí. _Por 


ejemplo, la i investigación: ha-demostrado que, en muchos aspectos, intervienen los 


mismos principios cuando las palomas aprenden a predecir la comida en base a 
uña señal visual, que cuando las ratas aprenden 2 predecir el dolor en base a una 
clave auditiva. Al considerar la generalización del aprendizaje, el problema fun- 
damental es la generalización de los mecanismos y principios del aprendizaje, no 
la generalización de los contenidos del aprendizaje. Sin duda, los contenidos del 
aprendizaje cambiarán de una situación a otra y de u una especie a otra, pero puede 


"que los principios y mecanismos no varíen. 


Las pruebas de que disponemos nos llevan a pensar que los principios ele- 
mentales de aprendizaje que se describirán en este libro tienen una considerable 
capacidad de generalización. La mayor parte de las investigaciones sobre aprendi- 
zaje animal se han realizado con palomas, ratas y conejos. Sin embargo, algunos 
de los principios de aprendizaje observados en esas especies de vertebrados han 
podido ser demostradas también con tritones (Ellins, Cramer y Martin, 1982), 
moscas de la fruta (Platt, Holliday y Drudge, 1980), abejas (Couvillon y Bitter- 
man, 1980, 1982; Menzel, 1983), moluscos terrestres (Sahley, Rudy y Gelperin, 
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1981) y los moluscos marinos Hermissenda crassicornts (Farley y a a 
Aplysia californica (Carew, Hawkins y Kandel, 1983) y Aplysia vespa ( e 
y Schwarz, 1983). Los estudios con Organismos como Hermissen 4 y Ap qe S 
particularmente apasionantes porque la simplicidad del sistema nervioso E estas 
especies ha permitido a los investigadores identificar los mecanismos e Ógicos 
responsables del aprendizaje (por ejemplo, Farley, Richards, E Er Z 
Alkon, 1983; Hawkins, Abrams, Carew y Kandel, 1983; Hawkins y Kandel, ; 
Kandel, 1976; Kandel y Schwartz, 1982). so 1 
La suposición de que. existen principios y mecanismos generales dp 
zaje ha sido una piedra angular del estudio del aprendizaje desde sus inicios. ; 
científicos, en contraposición a los ingenieros, están siempre motivados 7 a 
búsqueda de la generalización. Un ingeniero se enfrenta a un problema particu Aa 
por ejemplo, cómo endurecer un plástico. El ingeniero alcanza el a si encuen 
tra la solución a su problema, tanto sí la solución conlleva que el proce po > 
pueda aplicar de forma general como si no, La tarea del científico, más difícil, 
consiste en buscar soluciones generales, principios generales. A menudo, encon- 
trar una solución general depende del nivel de análisis que se emplee. oie pa 
plo, en el siglo XIX, los químicos sabían muchas cosas concretas acerca de lo que 
ocurriría cuando combinaban distintas sustancias químicas. Sin embargo, aa 
establecer una relación general de las reacciones químicas hubo que esperar a 
desarrollo de la tabla periódica de los elementos, que describía los elementos 
químicos en términos de sus constituyentes atómicos. De forma análoga, para 
establecer una relación general de los principios y procesos del AN ho 
requiere un análisis a nivel molecular del papel que juegan los estímulos y las 
respuestas en la conducta aprendida (Domjan, 1983). ha 
Hace unos quince años, numerosos investigadores sostuvieron que las ley 
del aprendizaje carecían de generalización, ya que se habían descubierto numero- 
sos fenómenos contrarios a los principios de aprendizaje que en ese q 
eran aceptados de forma general (por ejemplo, Rozin y Kalat, ee S > e- 
worth, 1972). Sin embargo, el descubrimiento de excepciones a una e general no 
supone que no exista generalización. Simplemente, indica que no mi mue: 
trado el principio general correcto. A la luz de nuevos descubrimientos, los e 
cipios de aprendizaje son continuamente modificados. El y A 
excepciones a una regla, únicamente requiere que la regla se modifique. urante 
los últimos quince años se han formulado, a la luz de nuevos datos, E prin- 
cipios de aprendizaje. La búsqueda de principios generales de aprendizaje E una 
empresa que continuará en tanto la ciencia de la conducta siga avanzando. 


EL ENFOQUE CONDUCTUAL Y OTROS ASPECTOS DE LA PSICOLOGIA 


Hay, probablemente, pocos aspectos de la naturaleza más ee y y E 
les de estudiar que la conducta. Como consecuencia de esta complejida , es difíci 
decidir la forma en que hay que abordar las investigaciones. Los científicos po se 
ponen de acuerdo para definir el asunto que hay que tratar, qué tipos de con =p 
estudiar primero, y cuánto tiempo seguir un enfoque antes de proceder con e 
siguiente estadio de análisis. La ausencia de respuestas obvias a estas CESRaO 
ha provocado que los psicólogos realicen sus trabajos de formas muy diferentes. 
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Algunos campos de la psicología pueden ser fácilmente diferenciados de otros en 
razón de los aspectos de la conducta que investigan. Por ejemplo, los psicólogos 
sensoriales investigan los procesos implicados en la sensación y la percepción, los 
psicólogos cognitivos están interesados por los procesos de pensamiento y proce- 
samiento de la información, y los psicólogos clínicos analizan la conducta anor- 
mal. También se pueden clasificar los distintos enfoques del estudio de la con- 
ducta según la complejidad de la conducta que es objeto de estudio. Por ejemplo, 
los psicólogos interesados en la personalidad y la inteligencia deben estudiar sis- 
temas conductuales muy complejos. No investigan respuestas individuales, sino 
estilos de respuesta y agregados de conducta organizados de forma muy compleja. 
Por ejemplo, una alta puntuación en un test de inteligencia o en un test de mascu- 
linidad no está referida a una respuesta concreta; más bien, gracias a estos tests 
podemos identificar un complejo entramado de tendencias de respuesta que tie- 
nen distintos grados de intensidad. 

El enfoque conductual puede distinguirse de otros enfoques de la psicología 
tanto por los aspectos de la conducta en los que se centra como por el nivel de 
complejidad de la conducta. Como ya se destacó, muchos experimentos que usan 
este enfoque sólo consideran aspectos de la conducta que pueden ser directamente 
observados, y se centran en respuestas discretas, pequeñas unidades de conducta, 
en vez de hacerlo en estilos de respuesta y entramados de tendencias. Se supone 
que los sistemas conductuales complejos consisten en la acción combinada de res- 
puestas más simples. Por tanto, hay que considerar la comprensión de estas res- 
puestas simples como un paso previo al estudio de los procesos psicológicos com- 
plejos. Además, la información obtenida al estudiar respuestas simples resulta útil 
para diseñar las investigaciones sobre sistemas más complejos. 

El enfoque conductual es sólo parte de una corriente global en la psicología, 
conocida como conductismo. Bajo esta corriente filosófica encontramos ideas muy 


diversas. Hay quien afirma que el enfoque conductual es el único que puede ser 


útil en el estudio de la psicología (Watson, 1913). Esta postura radicalmente con- 
ductista no es la que se defiende en este libro. Dada la complejidad de la conducta, 
y ya que, en este momento, no hay forma de saber cuál es la mejor forma de 
estudiarla, está justificada la diversidad de enfoques utilizados en la psicología 
contemporánea. El estudio de la conducta puede resultar provechoso si se realiza 
simultáneamente en distintos niveles de complejidad. La información obtenida 
con los distintos enfoques puede entonces fundirse para desarrollar una descrip- 
ción completa de la conducta. Cada nivel de análisis juega un papel integral en los 
estudios de este tipo, que presentan diversos enfoques. Así pues, los estudios 
sobre las bases fisiológicas de la conducta, las respuestas simples, y los sistemas 
complejos de respuesta (como los de la personalidad), hacen importantes contri- 
buciones para una completa comprensión de la conducta. Nuestro objetivo al 
defender este enfoque integrado no es infravalorar la importancia del enfoque 
conductual, sino permitir al lector que relacione mejor la información que este 


texto proporciona con la información sobre conducta que encontrará en otros 
tratados de psicología. 








Capítalg 2) 
CONDUCTA ELICITADA, HABITUACI 


Y SENSIBILIZACIÓN 


La discusión sobre los principios de aprendizaje y de conducta comienza en 
este capítulo con la descripción de la conducta elicitada —la conducta que tiene 
lugar como reacción a los acontecimientos ambientales—. Numerosos aspectos de 
la conducta están suscitados por acontecimientos ambientales, y la conducta elici- 
tada interviene en algunos de los sistemas de respuesta más extensamente inves- 
tigados. Esta discusión va desde una descripción de la forma más simple de con- 
ducta elicitada —la conducta refleja— hasta una discusión sobre las respuestas 
emocionales complejas suscitadas por los estímulos. En su desarrollo iremos des- 
cribiendo dos de las formas de cambió de conducta más simples y comunes: la 
habituación y la sensibilización. La habituación y la sensibilización pueden darse 
en una amplia variedad de sistemas de respuesta y son, por lo tanto, propiedades 
fundamentales de la conducta. 


LA NATURALEZA DE LA CONDUCTA ELÍCITADA 
El concepto de reflejo 
La naturaleza de los estímulos elicitantes de respuesta 
El papel de la retroalimentación en la conducta elicitada 
La conducta elicitada independiente de los estímulos retroalimentadores 
Intervención o ausencia del estímulo elicitante como retroalimentador 
Las respuestas provocadas y guiadas por diferentes estímulos 
LOS EFECTOS DE LA ESTIMULACION REPETIDA: TRES EJEMPLOS 
La succión en los mños 
La respuesta de sobresalto en las ratas 
El agrupamiento en los pinzones 
LOS CONCEPTOS DE HABITUACION Y SENSIBILIZACION 
Adaptabilidad y ámbito de la babituación y la sensibilización 
Análisis neurológicos de la habituación y la sensibilización 
Diferencias entre habituación, adaptación sensorial y fatiga 
Teoría del proceso dual de la habituación y la sensibilización 
CARACTERISTICAS DE LA HABITUACION Y LA SENSIBILIZACIÓN 
El curso temporal de la babituación y la sensibilización 
El curso temporal de la sensibilización 
El curso temporal de la habituación 
La especificidad para el estímulo de la babituación y la sensibilización 
El efecto de los estímulos extraños intensos 





El efecto de la intensidad y frecuencia del estímulo 
LOS CAMBIOS EN LAS RESPUESTAS EMOCIONALES COMPLEJAS 
La teoría de la motivación del proceso oponente 
Mecanismos de la teoría del proceso oponente 
Ejemplos de procesos oponentes 
El amor y el apego 
El paracaidismo 
La drogadicción 
COMENTARIOS FINALES 


- 
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LA NATURALEZA DE LA CONDUCTA ELICITADA 


Es una observación común que los organismos reaccionan a los acontecimien- 
tos del ambiente. Esto es así para todos los animales, incluidos los seres humanos. 
El ruido de un intruso provoca respuestas de defensa del territorio en los gorrio- 
nes de cabeza blanca. El olor de una perra o de una gata sexualmente receptivas 
suscita conductas de acercamiento y sexuales en el perro y en el gato. Si algo se 
mueve fuera de nuestro. campo de visión, es probable que volvamos la cabeza 
hacia ese lado. Un trozo de comida en la boca provoca salivación. La exposición a 
una luz brillante origina la contracción de las pupilas de los ojos. El dolor al tocar 
una superficie que quema provoca una respuesta rápida de retirada de la mano. La 
irritación de las vías respiratorias produce estornudos y tos. Estos estímulos y 
otros similares demuestran que gran parte de la conducta se da como respuesta a 
los estímulos -—está elicitada. 

La conducta elicitada ha sido tema de extensas investigaciones. Muchos capítu- 
los de este libro hacen referencia a ella de una forma o de otra. La discusión sobre 
la conducta elicitada comienza aquí con la descripción de su forma más simple, la 
conducta refleja. Después se discute la naturaleza de los estímulos que la desenca- 
denan y el papel que desempeñan las claves retroalímentadoras. 


El concepto de reflejo +: 


Un ligero soplo de aire dirigido a la córnea hace pestañear el ojo. Un golpe- 
ciro en un determinado lugar de la rodilla hace que la pierna dé una patada. Un 


sonido fuerte causa un sobresalto. Todos ellos son ejemplos de reflejos. Un reflejo. 


implica dos hechos estrechamente relacionados. Uno es el estímulo ambiental 
elicitañte; el otro es la respuesta específica. El estímulo y la respuesta están estre- 
camente ligados de una forma especial: la Aparición del estímulo generalmente 
da Jugar a. la aparición de la respuesta, y la respuesta pocas veces aparece en 
ausencia del estímulo. Por ejemplo, la salivación aparece en presencia de la 
comida y rara vez en ausencia de ésta. 

La especificidad de la relación entre un tipo concreto de estimulo y una res- 
puesta refleja concreta muestra la organización del sistema nervioso. En los ver- 
tebrados. (incluidos los humanos), un mínimo de tres neuronas. intervienen en la 
organización de los reflejos simples. La figura 2.1 muestra la organización nenro- 
nál de los reflejos simples. El estímulo ambiental activa una neurona sensorial o 
aferente- que trasmite el mensaje sensorial a la médula espinal. Desde a: aquí, los 
impulsos neuronalés se:trasmiten a la neurona motora o eferente, que elabora la 
respuesta morora observable, Sin embargo, las neuronas motóras y sensoriales no 
se Cómunican. directamente. Lo que sucede es que los impulsos se trasmiten de 
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Neurona sensitiva 


Neurona motora 


Sección transversal de la médula espinal 


Figura 2.1.—Organización neurológica de los reflejos simples. El estímulo ambiental activa una neu- 

rona sensitiva, que trasmite la información sensorial hasta la médula espinal. Aquí los impulsos neu- 

ronales son recogidos por una interneurona, que a su vez los trasmitirá a una neurona motora cuya 
función es activar 108 músculos implicados en el movimiento. 


unas a otras.a través de. Ai interngurona. Las interneuronas están dispuestas de tal 
“forma que un conjunto de neúrónas sensoriales se conecta sólO-con. un conjunto 
de neuronas motoras. Debido a esta conexión restringida entre unas neuronas 
sensoriales y IMOtoras concretas, la respuesta refleja sólo es desencadenada por un 
conjunto limitado de estímulos. Las neuronas aferentes, las interneuronas y las 
neuronas eferentes constituyen todas juntas lo que se llama arco reflejo. 
“Enlos. vertebrados el arco reflejo representa el mínimo de conexiones neuro- 
nálés, necesario para la acción refleja. En la elicitación de reflejos suelen interve- 
"nir estructuras neuronales adicionales. Los mensajes sensoriales se trasmiten con 
frecuencia al cerebro, que puede influir de distintas maneras en el desarrollo del 
reflejo. Por ejemplo, los mecanismos de activación del cerebro pueden afectar a la 
excitabilidad de las interneuronas. Así, si uno está muy activado después de una 
buena película de terror, es fácil que se sobresalte cuando alguien le da un golpe- 
cito en el hombro por detrás. Discutiremos con más detalle este tipo de efecto al 
final del capítulo. De momento, es importante recordar que incluso en la forma- 


* ción de los-reflejos, simples pueden influir funciones propias del sisterna nervioso 
- SUPerior. 


Los, reflejos se han desarrollado, sin duda, para proporcionar un ajúste. com- 
“="portamental rápido. Es evidente que la mayoría de los reflejos facilitan el bienes- 
tar del organismo. Por ejemplo, en muchos animales la estimulación dolorosa de 
un miembro provoca la retirada o la flexión de ese raiembro y la extensión del 
miembro opuesto (Hart, 1973). Así pues, si al andar, la pata de un perro tropieza 
contra algo, la retirará automáticamente y estirará simultáneamente la pata 
opuesta. Esta combinación de respuestas permite al animal evitar el dolor al reti- 
rar la pata y, a la vez, mantener el equilibrio. La misma secuencia de respuestas ' 
reflejas no beneficia, sin embargo, al perezoso de dos pezuñas, un mamífero que 
pasa mucho tiempo colgado de las ramas boca arriba. Imagínese qué ocurriría si 
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Figura 2.2.-—La estimulación do- 
lorosa de la pata de un perro 
provoca la retirada (flexión) de 
esa pata, y, simultáneamente, la 
extensión de la para contraria. 
Por el contrario, la estimulación 
dolorosa dela pata de un pere- 
zoso (animal arbóreo de la re- 
gión tropical) provoca extensión 
de esa pata y flexión de la con- 
traria. (Según Hart, 1973.) 








Y 
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respondiera al dolor del mismo modo que el perro. Si flexionara el miembro 
herido y extendiera el miembro del lado opuesto acabaria por cargar la mayoría 
de su peso en la pata herida. Como podría suponerse, el perezoso ha desarrollado 
una secuencia diferente de respuestas: extiende la pata herida, quitando esa pata 
de la rama, y flexiona la pata contraria cargando la mayor parte de su peso en esa 
pata, como muestra la figura 2.2 (Esplin y Woodbury, 1961). 

Los “reflejos innatos constituyen una parte importante del repertorio conduc- 
tual de los niños Tecién nacidos. Como éstos no han tenido mucho tiempo para 
¿prender cómo deben” responder a los acontecimientos ambientales, tienen que 
sobrevivir gracias a las reacciones innatas a los estímulos. Algunos de estos refle- 
jos pueden ser motivo de diversión para los padres. Por ejemplo, los bebés recién 
nacidos, de forma refleja, aprietan los dedos alrededor de cualquier cosa que se les 
ponga en la mano. Otro reflejo importante es el que se desarrolla para facilitar el 
encuentro del pezón; si tocamos la mejilla de un bebé con el dedo, el bebé, de 
forma refleja, volverá la cabeza en esa dirección, dando lugar, probablemente, a 
que nuestro dedo acabe en su boca. Cuando un objeto se encuentra en la boca de 
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Figura 2.3.-——Mamar es uno de 
los reflejos más destacados del 


bebé, 


un bebé, éste succionará de manera refleja. Cuanto más semejante sea el objeto a 
un pezón, más fuerte será la conducta de succión elicitada. 

La organización de la conducta refleja puede traer consigo dificultades inespe- 
radas a pesar de que las respuestas reflejas sean beneficiosas para el organismo. 
Los reflejos de succión y de volver la cabeza facilitan la alimentación de los recién 
nacidos. Sin embargo, a veces se interpone otro importante reflejo, el reflejo de 
oclusión respiratoria. El reflejo de oclusión respiratoria se estimula con la reduc- 
ción del flujo de aire al bebé, que puede estar causado, por ejemplo, por una 
sábana que se le pone encima o por una acumulación de flermnas en las vías respi- 
ratorías. Cuando el bebé se encuentra con una disminución del flujo de aire, su 
primera reacción es echar la cabeza para atrás. Si con este movimiento no logra 
apartar el estímulo elicitante, agitará las manos como frotándose la cara. Si de 
esta manera tampoco consigue retirar el estímulo elicitante, entonces se pondrá a 
llorar. El: llanto trae consigo una fuerte expulsión. de aire, que a menudo es sufi- 
ciente para rétirar aquello que obstruye las vías respiratorias. El reflejo respirato- 
rio oclusivo es evidentemente esencial para la supervivencia. Si el bebé no toma 
aíre suficiente, se ahoga. El problema surge cuando se desencadena el reflejo de 
oclusión respiratoria mientras el niño está mamando. En esta situación el bebé 
sólo puede respirar por la nariz. Si la madre lo aprieta demasiado contra su 
pecho, de forma que los orificios de la nariz queden obstruidos, se estimula el 
reflejo de oclusión respiratoria. El bebé intentará apartar la cabeza del pezón, es 
posible que dé un manotazo a su cara para retirarla del pezón y también es 
posible que se ponga a llorar, Así pues, una lactancia satisfactoria requiere un 
poco de experiencia. La madre y el niño tienen que acoplarse para que la lactancia 
avance sin la estimulación del reflejo de oclusión respiratoria (Gunther, 1961). 


La naturaleza de los estímulos elicitantes de respuesta 


En todos los ejemplos de reflejos descritos anteriormente, el estímulo elici- 
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tante resulta bastante obvio. Sin embargo, no en todas las conductas elicitadas es 
siempre así. En muchas situaciones, una respuesta está suscitada por una.secuen.. 
cia ia compleja de de acontecimientos o de estímulos, y_no es fácil decir con exactitud 


A Ra 


qué características de la situación son esenciales para la aparición de la respuesta. 
Considérese, por ejemplo, la secuencia de hechos que tienen lugar durante la 
alimentación de los polluelos de las gaviotas. Los polluelos se quedan en el nido 
después de salir del huevo y para alimentarse necesitan que les lleven la comida. 
Cuando el padre vuelve de comer, el polluelo le picotea en la punta del pico 
(véase figura 2,4). Esto provoca que el adulto regurgite y recoja parte del vómito 
en el pico. Cuando el pollito continúa dando picotazos en el pico, logra coger algo 
de la comida regurgitada y de esta forma obtiene todo su alimento. 


Figura 2.4.— Alimentación de las 
crías de la gaviota arenquera. La 
cría picotea en una mancha roja 
que el adulto tiene cerca del ex- 
tremo del pico, haciendo que el 
adulto regurgite comida para ella. 





Uno de los aspectos esenciales de esta secuencia de alimentación es la forma 
en que los polluelos picotean en el pico del padre para estimular la regurgitación. 
Esta conducta elicitada es innata. Sin embargo, a partir de observaciones casuales 
no se pueden identificar fácilmente las características estimulares esenciales para 
provocar la conducta de picoteo. Las gaviotas tienen un pico largo y amarillo, con 
una mancha de color rojo fuerte cerca de la punta. El picoteo en los polluelos 
puede estar provocado por los movimientos del padre, por el color, la forma o la 
longitud del pico, por los ruidos que emiten los padres o por cualquier otro estímu- 
lo. Con objeto de aislar las características importantes en la respuesta de pícoteo, 

“Tinbergen y Perdeck (1950) investigaron la conducta de los polluelos de gaviotas 
con distintos modelos artificiales en vez de gaviotas vivas. Como resultado de esta 
investigación llegaron a la conclusión de que un modelo debía tener varias carac- 
terísticas para provocar un picoteo significativo, El objeto tenía que ser largo, 
delgado, en movimiento, con una punta hacia abajo y con una mancha roja visible 
cerca de la punta. Estos experimentos sugieren que el color amarillo del pico del 
adulto, la forma y colorido de la cabeza y los ruidos que ernite mo son importantes 
para suscitar el picoteo en los polluelos de gaviota. Las características específicas 
que eran necesarias para producir la conducta de picoteo recibieron. el nombre de 


estímulo señal o estímulo desencadenante. 
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Se han identificado otros estímulos señal en las investigaciones sobre conducta 
elicitada. Un ejemplo clásico es el de los estímulos que provocan agresión o cor- 
tejo en el espinoso de tres espinas, un pez pequeño que se aparea en primavera. 
-Durante la estación de apareo, el macho delimita su territorio y lo defiende. St 
otro macho se mete en él, lo ataca, En cambio, sí es una hembra la que entra, la 
corteja. ¿Cómo distingue el ocupante del territorio entre el pez al que debe atacar 
y el pez al que debe cortejar? Un intruso macho tiene varias características esti- 
mulares (un patrón concreto de movimientos, un tipo de colorido, tamaño, forma, 
etc.). Para aislar las características estimulares esenciales se hicieron experimen- 
tos con espinosos machos utilizando distintos modelos de cartón. Esta investiga- 
ción mostró que para provocar agresión, el modelo tenía que tener la parte infe- 
rior de color rojo. El movimiento también resultó ser importante. El modelo 
tenía más probabilidad de ser atacado cuando aparecía boca abajo, con una postura 
semejante a la del pez vivo amenazador, Sin embargo, la característica estimular 
esencial para evitar el ataque y probablemente producir el cortejo era tener la 
parte inferior redonda, hinchada, parecida a los espinosos hembras cuando llevan 
muchos huevos. 


El papel de la retroalimentación en la conducta elicitada 


Las respuestas tienen, por lo general, consecuencias sobre los estímulos. Esto 
ocurre en todas las conductas, incluidas, las respuestas provocadas por aconteci- 
mientos ambientales. Cuando la pupila se contrae por una luz intensa, llega 
menos luz a la retina como resultado de la contracción. La salivación provocada 
por la comida en la boca hace que la comida se ablande y se disperse. La tos y el 
estornudo, como respuestas a la irritación de las vías respiratorias, producen un 
ruido fuerte y una expulsión rápida de aire y normalmente eliminan la irritación. 
Al estímulo específico que es resultado de una respuesta concreta se le llama 


- estímulo retroalimentador de esa respuesta. La consideración del papel que desem- 





peñan los estímulos rerroalimentadores nos proporciona un conocimiento impor- 

tante de la conducta. En esta sección vamos a considerar el papel de la retroali- 

mentación en el control de la conducta elicitada innata. En capitulos posteriores 

discutiremos el papel de la retroalimentación en el control de las respuestas 
aprendidas. 

Los estímulos retroalimentadores pueden surgir del interior o del exterior del 

- Organismo. Las claves retroalimentadoras internas son, proporcionadas por las. 

Neuronas: sensoriales que permiten que el animal sienta los movimientos de los 


culós y articulaciones. que intervienen. en la respuesta. Si una persona nos da 
un pena en la rodilla en el sitio adecuado y provoca el reflejo de estirar la 
' pierna, sentimos que nuestra pierna da uma patada. Podemos saber en qué 
momento hemos respondido, incluso con los ojos cerrados, gracias a la sensación 
que producen las neuronas sensoriales en los músculos de las piernas y en las 
articulaciones de la rodilla. A esas claves retroalimentadoras internas se las llama 


A 


“esqueleto crea sensaciones propioceptivas. Sin embargo, no todas las respuestas 
reflejas van acompañadas de claves propioceptivas. Por ejemplo, la contracción de 
la pupila produce pocas sensaciones internas. Más bien, la retroalimentación que 





e 
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resulta de la contracción de la pupila ocurre porque llega menos luz a la retina. 
Esta retroalimentación cambia los estímulos externos a los que está expuesto el 
organismo. Vamos a tratar solamente el papel de esas claves retroalimentadoras 
externas en la conducta elicitada. Algunos patrones de respuesta son, en gran 
medida, independientes de las claves retroalimentadoras externas. En otros casos 
la conducta está casi exclusivamente controlada por la retroalimentación. 


La conducta o independiente de los estímulos retroalimentadores. _Hay 
respuestas que una vez iniciadas acaban siendo independientes de sus consecuen 


cias. Dada la naturaleza fija de tales respuestas, han recibido el nombre de pautas 


fijas de acción. En la conducta animal existen numerosos ejemplos de patrones 
“fijos de acción. En los animales domésticos se pueden observar algunos de ellos. 
Los gatos, por ejemplo, cuando comen, dan a menudo un mordisco, agitan suave- 
mente la cabeza y después mastican y tragan. La respuesta del movimiento de la 
cabeza resulta útil cuando el gato está a punto de comerse un ratón vivo porque le 
ayuda a matar al ratón. Esta parte del patrón fijo de acción continúa dándose 
incluso cuando no es preciso matar para comer. Se observa con frecuencia otra 
pauta fija de acción en los gatos cuando utilizan una caja para sus deposiciones. 
Los gatos, al acabar de evacuar, remueven la tierra hasta cubrir totalmente sus 
excrementos. Sin embargo, esta respuesta de arañar la tierra es independiente de 
sus consecuencias estimulares. Los gatos arañan la tierra después de evacuar, 
durante un rato, tanto si la tierra cubre los excrementos, como si no. De hecho, a 
veces arañanm un lado de la caja y mi siquiera mueven la tierra. 

Un ejemplo curioso de patrón fijo de acción es la conducta de hilado del 


? 


“+ proporciona ún buen ejemplo. La cochiñilla (Porcellio scaber) es una isópoda 
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elicitante, la respuesta persistirá. Por el contrario, si la respuesta aparta al animal 
del estímulo elicitante, la respuesta cesará, 

Ya nos hemos encontrado antes con unos sistemas reflejos en los que la 
retroalimentación de la respuesta venia dada por la presencia o ausencia de un 
estímulo elicitante. Considérese, por ejemplo, el reflejo de succión de los niños 
recién nacidos. Cuando se le ofrece el pezón, el niño empieza a succionar. Esta 
respuesta sirve para mantener el contacto entre el bebé y el pezón. El contacto 
continuo, a su vez, provoca más respuesta de succión. En otros casos la respuesta 
refleja provoca un alejamiento del estímulo elícitante. El estornudo y la tos refle- 
jos, por ejemplo, suelen hacer desaparecer la irritación de las vías respiratorias 
que en un principio provocaron la conducta. Cuando la irritación desaparece, la 
tos Cesa. - 

El hecho de que..la. epalmentición implique la presencia o, ausencia del 
estímulo o elicitante es muy. importante en el control del movimiento locomotor 
reflejo dé muchos animales. Existe un tipo de locomoción refleja en que el estí-. 
mulo elicitante produce un cambio en la velocidad del movimiento (o en la velo- 
cidad para dar la vuelta), con indej endencia de la dirección que tome. Á los. 
movimientos de este tipo se les llama quinesis. La conducta de las cochinillas nos 


: pequeña que se encuentra normalmente en zonas húmedas, rocas, tablas, hojas. Si 
partiéramos de una observación casual de las cochinillas, es fácil que llegáramos a 
e conclusión de que las cochinillas se trasladan a los lugares húmedos porque los 


: prefieren. Sin embargo, su tendencia a congregarse en lugares húmedos es el 
; resultado de uma quinesis. Los niveles bajos de humedad provocan movimiento 


capullo de la araña Ciprennium salei (véase Eibl-Eibesfeldr, 1970). La araña E le | locomotor en los piojos. Mientras el aire permanece seco, los piojos siguen 
empieza hilando el fondo del capullo; después teje los lados. Pone los huevos 2 23, | moviéndose. Conforme van llegando a lugares húmedos aumenta la proporción * 
dentro y, a continuación, hila la parte superior del capullo y de ese modo lo cierra, E Y 8 | de ellos que se quedan inactivos. Así pues, tienden a congregarse en áreas de alta 
Esta secuencia de respuestas es llamativa porque ocurre en el orden que se ha = E humedad, no porque prefieran tales áreas y salgan a buscarlas «voluntariamente», 
especificado aunque el experimentador altere el resultado habitual. Por ejemplo, E: 2. | sino porque en los lugares húmedos el estimulo para el movimiento está ausente 


la araña seguirá hilando los lados del capullo y depositará los huevos aunque el 
fondo del capullo esté destruido y los huevos se salgan. Si se coloca la araña en un 
capullo parcialmente terminado, comenzará la secuencia de respuestas de hilado 
COMO si tuviera que empezar un nuevo capullo desde "el principio. Otro aspecto 
curioso es que las respuestas de hilado se desarrollan exactamente de la misma 
forma aunque la araña sea incapaz de producir el material con el que construir el 
capullo. Asi pues, a pesar de parecer que la araña lleva a cabo los movimientos de 
hilado con el fin de tener un lugar para depositar los huevos, las consecuencias de 
la conducta no controlan su aparición. (Para otros ejemplos de patrones fijos de 
acción, véase Barnett, 1981.) 


Intervención o ausencia del estímulo elicitante como retroalimentador. Los 
patrones de acción fija como los que se han descrito arriba están producidos, por 
lo general, por estímulos desencadenantes discretos. En otras situaciones, las res- 
puestas están provocadas por estímulos que se presentan durante un tiempo 
largo. En algunos de estos casos, la respuesta eltcitada puede mantener al animal 
en contacto con el estímulo elicitante, o bien apartarlo de él. La futura aparición 
de la respuesta vendrá determinada por el hecho retroalimentador que finalmente 
ocurra. Si la respuesta refleja mantiene al animal en contacto con el estímulo 


(Fraenkel y Gunn, 1961). 

La quinesis determina además una situación de reposo en otras clases de ani- 
males. En contraste con las cochinillas, los, saltamontes, adultos y las larvas son 
más activos en las zonas húmedas y más inactivos en las secas (Riegert, 1959). 
Esta respuesta aumenta la probabilidad de que permanezcan en lugares secos. En 
los platelmintos, la quinesis está controlada por la iluminación más que por la 
humedad. Existen varias clases de platelmintos que tienen más probabilidad de 
pararse en lugares oscuros que en los bien iluminados (Walter, 1907; Welsh, 
1933). Se puede hallar otra quinesis importante controlada por la luz en las larvas 
de la lamprea de los arroyos (Lampetra planers). Cuando se exponen a la luz, 
estos animales culebrean con la cabeza hacia abajo. Cuanto mayor es la ilumina- 
ción, mayor es la actividad. En los sustratos enlodados, con el movimiento de 
culebreo van haciendo sus madrigueras en el suelo. La excavación de la madri- 
guera continúa hasta que los receptores de luz que poseen en la punta de la cola 
se cubren de barro (Jones, 1955). 

La quinesis praduce-movimientos hacia (o en sentido opuesto a) estímulos 
concretos como resultado. indirecto de los “cambios en la velocidad de los movi- 
mientos desencadenados por los estímulos. En otro tipo de proceso de locomoción, 
refleja, el estímulo crea directamente movimientos hacia él o en sentido OPuesto. 
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_, Á este tipo de mecanismo se le llamé taxia, Una taxia se clasifica según la natura- 
— Teza del éstimulo elicitante y la dirección dé su movimiento: hacia el estímulo o en 
sentido opuesto. Los gusanos de tierra tienden a apartarse de la luz intensa 
(Adams, 1903). B3te es. 10.ejemplo.de.forotaxia negativa. La sanguijuela. de Amé- 
rica del Sur se Oriente y dirige a los cuerpos calientes, (Wigglesworth y Gillert, 
4). En el laboratorio, por ejemplo, sé dirigirá hacia un tubo de ensayo con agua 
caliente: "Este es un ejemplo de termotaxia positiva. El caracol de árbol presenta 
una geotaxia negativa (Crozier y Navez, 1930). Cuando se tira de la concha en una 
dirección se produce un movimiento en dirección contraria. Por naturaleza esto da 
lugar a que el caracol suba los árboles porque la gravedad empuja su concha hacia 
el suelo. En muchos insectos, la dirección de su vuelo está controlada por la taxia. 
Las langostas, por ejemplo, tienen pequeños mechones de pelo en la parte frontal 
de la cabeza. Estos animales orientan su vuelo en la dirección hacia la que se 
doblan los pelos (Weiss-Fogh, 1949). Los cambios en la orientación del vuelo 
producen una retroalimentación en forma de cambios en el mechón de pelos, y 
esta retroalimentación estimula más cambios en la orientación que hacen que la 
langosta vuele directamente en el mismo sentido que el viento. 
Las taxias y las quinesis son curiosas porque ilustran cómo las respuestas que 
aparentan ir dirigidas a una meta y ser voluntarias pueden estar producidas por 





la conducta de las cochinillas no es necesario postular que les gusta salir a buscar 
lugares húmedos. Del mismo modo, no es necesario postular que las langostas 
van buscando volar en la misma dirección que el viento o que les gusta hacerlo 
así. Más bien, lo que ocurre es que los movimientos que aparentemente van diri- 
gidos a una meta pueden explicarse en términos de respuestas reflejas controladas 
por claves retroalimentadoras, que consisten en la presencia o la ausencia de 
estímulos elicitantes. El movimiento de orientación / locomoción persistirá en 
tanto en cuanto la retroalimentación de la respuesta implique un contacto conti- 


nuo con el estímulo elicitante, y cesará cuando se den otros tipos de claves retroa- 
limentadoras. 


— Las respuestas provocadas y guiadas por diferentes estímulos. Hasta ahora 
hemos discutido la conducta elicitada que era independiente en gran medida de las 
claves retroalimentadoras y la conducta elicitada que estaba controlada por una 
retroalimentación en la que intervenía la presencia o ausencia de un estímulo 
elicitante. Existen también respuestas innatas que están provocadas por un estímo- - 
lo y guiadas por una. retroalimentación en la que interviene un segundo estímulo. 
Nos proporciona un buen ejemplo la Tilapia mossambica, un pez parecido al 
róbalo que incuba los huevos en la boca. Después de la incubación, las crías se: 
quedan junto a la madre unos días. La aproximación de un objeto grande, o cual- 
quier turbulencia en el agua, hace que las crías naden hacia la madre. Más concre- 
tamente, se acercan a las partes inferiores y a las zonas más oscuras. Cuando 
alcanzan a la madre continúan empujando sobre su superficie y penetran en unos 
agujeros, y de esa manera muchas de ellas acaban en la boca de la madre. Si la 
madre es reemplazada por un modelo, las crías también se aproximarán a las 
zonas inferiores y a las parcelas oscuras y empujarán contra esas zonas (Baerends, 
1957). El estimulo que desencadena la secuencia completa de respuestas es la 
aproximación de un objeto grande o una turbulencia en el agua. Sin embargo, la 
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conducta está guiada por otras claves: el lado inferior de la madre (o del modelo) 
las oscuras. 
? os aspectos de la respuestá de recuperación de los huevos en los pasos 
comunes ilustran también la forma en que un estímulo puede ser responsab e de 
provocar una respuesta y otro de guiarla (Lorenz y Tinbergen, 1939). Siempre 
que un huevo rueda fuera del nido, el ganso lo alcanza y lo lleva de vuelta a su 
sitio arrastrándolo con el pico. Esta conducta tiene dos componentes. Uno Impr 
extender el cuerpo para alcanzar el huevo que se había desplazado, movién olo 
después con el pico hacia el nido. El otro componente es el de mantener el pico 
en contacto con el huevo, con lo que se consigue que el huevo ruede, El pe 
componente es un patrón de acción fija puro. Una vez que se Inicia ega a 
término cualquiera que sea el tipo de retroalimentación que se produzca pue 
de que el ganso ha extendido su cuerpo para alcanzar el huevo, hace mana e 
pico hasta el nido, aun en el caso de que, en el camino, el huevo que lleva de eo 
se le escape rodando. Por el contrario, los movimientos de balanceo del pico sólo 
ocurren si el objeto que arrastra el ganso es redondo con forma de huevo. 3 como 
sustituto se le coloca un tubo recto que no se bambolee, los movimientos de 
balanceo no se producen. Estos movimientos están gobernados, cas por com- 
pleto, por una retroalimentación de la respuesta. Si el huevo se po ea en una 
dirección, el ganso moverá el pico más hacia ese lado para sujetarlo. se move 
miento puede dar lugar a que el huevo se mueva en dirección contraria, , cua 
produce otro balanceo. La secuencia de respuestas guiadas mediante retroa men 
tación continúa hasta que el ganso recorre con el pico todo el camino de vuelta a 


nido. 


LOS EFECTOS DE LA ESTIMULACIÓN REPETIDA: TRES EJEMPLOS 


La conducta elicitada se considera con frecuencia invariable, debido a que ena 
' conducta elicitada se da una relación estrecha entre un acontecimiento apbiente.Y.. 
la respuesta resultante. Tendemos a suponer que una respuesta elicitada —-.es- 
pecialmente una respuesta refleja simple— va a darse automáticamente de la 
misma manera cada vez que se presente el estímulo elicitante. Consideremos, por 
ejemplo, que un bebé mamará con un vigor invariable cada vez que z e presenta 
un pezón. Si la conducta elicitada ocurriera del mismo modo cada vez que e 
presenta el estímulo elicitante, tendría escaso interés, en especial para los Invest 
gadores del aprendizaje. Como aprendizaje _ entendemos los cambios en co, 
ducta que son resultado de la experiencia. Si la conducta elicitada fuera invariable, 

so tendría mucha relevancia. para..el estudio del aprendizaje. a 
En contra de lo que comúnmente se supone sobre. la,.conducra.elicitas ay 
cefleia esta conducta no es invariable. Uno de los hechos más llamativos de la 


conducta es su plasticidad. Incluso las respuestas eliciradas simples no ocurren de 











re 


la misma manera cada vez que se presenta el estímulo elicitante, Nuestra discu- 


sión sobre el papel de las claves retroalimentadoras en la conducta elicitada indi- 





“caba que, en algunos casos, las claves retroalimentadoras que resultaban de las 


respuestas alteraban la naturaleza de la conducta elicitada. Los ejemplos que 
damos a continuación ilustran varias formas en que la conducta elicitada puede 
cambiar como resultado de una estimulación repetida. 


E E 
PES 
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La succión en los niños 


La respuesta de sobresalto en las ratas 


e 


AA 


Uno de los reflejos más importantes en los humanos recién nacidos es el 


: Puede observarse en muchos otros sisternas de respuesta el mismo tipo de 

reflejo de succión. Como ya advertimos antes, los bebés succionan cuando se E variaciones de la conducta elicitada que se producen cuando un estímulo se pre- 

pone en la boca algo como un pezón, un dedo o un chupete. Algunos EROS do senta de forma repetida para provocar la succión. Un ejemplo nos lo proporciona 

: a cuan : : 

res han a O to E = a ro E dc A de sobresalto en las ratas. La respuesta de sobresalto consiste en un 
nta el estímulo elícitante. u > ibi tá y Í- 

se Le E ción refleja con una tetina de biberón y la succión con un trozo de sa . súbito O o as $ los músculos de a di se Epia pa estí 

co E de zoma de seis milimetros. Los estímulos se presentaban de forma mulo inesperado. Uno puede tener un gran sobresalto, por ejemplo, cuando un 

A : : ; 
ida ade recién nacidos. Cada presentación del estímulo duraba diez segun- Al de Eos ei: niega por o ás e de “Ya Eo En el o 
dy eonccorcian frelnra Seguadas ene las sucesivas presentaciones. Las prue- n las ratas la reacción puede medirse colocando al animal en una cámara estabi- 


bas con el tubo y la tetina se alternaban de manera que los bebés recibían e 
sesiones con un estímulo y después cinco con el otro, y asi sucesivamente. La 
figura 2.5 muestra el número de respuestas de succión observadas en cada prueba, 


limétrica (véase figura 2.6). Un estabilímetro es un pequeño recinto sujetado con 
varios muelles. Cuando el animal se sobresalta, da un salto produciendo un 


movimiento fuerte de la cámara estabilimétrica. Los movimientos repentinos de 


Los resultados que aparecen en la figura 2.5 tienen varios aspectos a la cámara pueden ser medidos con precisión para registrar la fuerza de la reacción 
En primer lugar vemos que la cantidad inicial de succión difiere de un estimulo a a os | 


otro. Los bebés succionaban más la tetina que el tubo de goma. Esto no es 2 ] 
prendente porque la tetina, sin duda, se parece más al estímulo original (el pez n 
de la madre) que el rubo. En segundo lugar, había diferencias sistemáticas a os 
patrones de respuestas ante las presentaciones repetidas de los dos estímulos. medi a sespuca de sobra 
Generalmente, a medida que aumentaba el número de presentaciones de la ie eo sas. Uno pequeña ja se 
los bebés succionaban más fuerte: El'1 nivel general de succión fue más alto en la Muelle 3 E plataformas estáricas (una'enci- 
quinta serie de cinco ensayos que en 14 primera serie. Además, dentro de cada A 
Sétié de cinco ensayos con la retina, los bebés incrementaban la succión del ea epa ea de alam- 
ensayo al último. Se dio la tendencia contraria cuando a los bebés se les hizo la ba ne a ondo de lr 
prueba con el tubo, En este caso el nivel general de succión fue más bajo en la Ls moviminas bc de ha 
serie quinta de cinco ensayos que En la primera, y los bebés normalmente dismi- qu prov moviniens de 
nuían la succión del primer ensayo al quinto de una misma serie. la cn que generan crime 
bre. (Según Hoffman y Fleshler, 
1964.) 


Figura 2.6.—Estabilimerro para 
medir la respuesta de sobresalto 


Figura 2.5.— Número de respues- 
cas de succión en humanos recién 
nacidos durante sucesivos ensa- 





yos. Un pezón de goma y un be AA 
tubo de goma sirvieron como al 
estímulos en bloques alternos de 
cinco ensayos. (Según Lipsitt y 
Kaye, 1965.) 


La reacción de sobresalto puede obtenerse con ratas utilizando toda clase de 

estímulos, entre los que podemos incluir un tono y una luz cortos. En cierto 

; experimento, Davis (1974) investigó la reacción de sobresalto en las ratas ante la 

presentación de un tono fuerte (110 decibelios [dB], 4.000 ciclos por segundo) y 

corto (90 milisegundos). Se realizó el experimento con dos grupos de ratas. Cada 

grupo recibió 100 ensayos sucesivos con el tono, separados entre ellos treinta 

5 10 15 20 25 30 35 40 45 50 segundos. Además, un generador de ruido producía un ruido de fondo parecido al 

del agua cuando sale del grifo. En un grupo, el ruido de fondo era relativamente 
flojo (60 dB); en el otro, el ruido era bastante fuerte (80 dB). 

En la figura 2.7 se muestran los resultados del experimento. Tal como ocurría 
en el reflejo de succión, las presentaciones repetidas del estímulo elicitante (el 
“tono dé" 4.000 ciclos por segundo) no siempre producen la misma respuesta de 
sobresalto, En los experimentos realizados poniendo a los sujetos en presencia de 
un sonido de fondo suave (60 dB), las repeticiones del tono producían reacciones 


N*? de respuestas de succión 





Ensayo 
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Figura 2.7.—Magnitud de la res- 
puesta de sobresalto de ratas ante 
las sucesivas presentaciones de 
un tono con un ruido de fondo 
de 60 u 80 dB. (Según Davis, 
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de sobresalto cada vez más pequeñas. Este resultado es similar al que se observó 
cuando se presentaba a los bebés de forma repetida el tubo de goma para que 
provocara la succión. Por el contrario, cuando el ruido de fondo era fuerte 
(80 dB), las repeticiones del tono suscitaban reacciones de sobresalto progresiva- 
mente más duraderas e intensas. Este resultado es comparable al que se observó 
cuando se provocaba la succión de forma repetida con la tetina. Así, pues, del 
misma modo, que ocurría en la succión, al desencadenar de forma repetida el del 
_teflejo de sobresalto se produce un descenso en la reacción de sobresalto en unas 
“circunstancias y un aumento En Otras. o 


e 


El agrupamiento en los pinzones 


En los ejemplos descritos anteriormente, las presentaciones repetidas del 
estímulo elicitante producían una disminución o un aumento de la respuesta elici- 
tada. Existen muchos ejemplos de esos cambios unidireccionales en la disposición 
a responder provocados por una estimulación repetida. Sin embargo, en otras 
muchas circunstancias se da una combinación de esas dos clases de cambios. La 
estimulación repetida puede producir en un principio un aumento en la disponibi- 
lidad para responder, a la que sigue un descenso. Para ilustrar la variedad de 
sistemas de respuestas en las que se da ese tipo de cambios en la disponibilidad 
para responder, vamos a describir la conducta de agrupamiento en los pinzones. 

En gran variedad de pájaros pequeños se produce el agrupamiento dirigido a 
un predador potencial. Cuando el agrupamiento es de tamaño suficiente, la con- 
ducta de los pinzones puede originar que el predador abandone la zona. Los pin- 
zones, por ejemplo, atacarán en masa a un búho o a un modelo de búho disecado. 
Cuando aparece el búbo por primera vez, los pájaros se agitan y empiezan a 
mover la cabeza y a continuación el cuerpo y la cola. Si el búho permanece, la 
fuerza de los movimientos se incrementa, y los pájaros empiezan a realizar «la 
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llamada de agrupamiento». Si hay suficientes pinzones en la zona, la llamada de 
agrupamiento puede llegar a ser muy estruendosa y asustar al búho que se aleja 
En un experimento ya clásico, Hinde (1954) midió las llamadas de agru a 
miento de pinzones individuales en respuesta a un búho disecado que se presentó 
de forma continua durante treinta minutos. La figura 2.8 muestra las llamadas de 
tres pájaros durante este período de treinta minutos. La presencia de un búho 
disecado produjo inicialmente un aumento progresivo en la llamada de agrupa 
miento. Sin embargo, como el estímulo del búho permanecía, la intensidad de. la 
llamada disminuyó gradualmente. La llamada de agrupamiento cesó casi por 
completo en el primer y en el tercer pájaro cerca del final del período de prueba 
de treinta minutos. El segundo pinzón continuó dando la llamada de agrupa- 
miento otros treínta minutos. Sin embargo, la intensidad de su llamada también 
descendió con la exposición prolongada al búho disecado. 


Figura 2.8.— Llamadas de agru- 
pamiento de tres diferentes pin- 
zones a los que, durante 30 mi- 
nutos, se les mostraba un búho 
disecado. (Según Hinde, 1954.) 


Llamadas por 10 seg. 





Minutos 


El patrón de respuestas que aparece en los pinzones se observa en una amplia 


variedad de especies dentro de una gran variedad de situaciones (pará una revi- 


si Jo . r os o + 
són, véase Thompson, Groves, Teyler y Roemer, 1973). Con presentaciones 
repetidas (o:con una presentación prolongada) del estímulo elicitante las respues- 


A 


t: , % . a. > Tp pr A ió 

_ fas cumentan en un primer momento y después disróinuyen. No se da la forma 
opuesta de cambio bidireccional en la disponibilidad para responder: una dismi- 
nución inicial en las respuestas seguida de un aumento. 
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LOS CONCEPTOS DE: HABITUACION Y SENSIBILIZACIÓN 

Los tres estudios descritos arriba muestran que se ele dar tanto un aumento 
como una disminución en la respuesta al presentar de forma repetida (o conti- 
nua) un estímulo elicitante. Una disposición decreciente. para responder como 
resultado de una estimulación repetida es un ejemplo de habituación. La disposi- 
ción creciente para responder es un ejemplo de sensibilización. La habituación y 
a sensibilización representan los cambios de conducta fundamentales que surgen 
a partir de la experjencia. 


Ádaptabitidad y ámbito de la babituación y la sensibilización 


En toda situación existen estímulos con los que el organismo se encuentra sin 
cesar. Los procesos de habituación y sensibilización 1 ayudan a a organizar y a dirigir. 
la conducta para que resulte eficaz en “todo. ese. mar de estimulación. En una 
situación tan simple como sentarse a una mesa intervienen innumerables sensa- 
ciones. Existen el color, la textura y el brillo de la pintura de las paredes; el 
sonido del aparato de aire acondicionado; los ruidos de la habitación de al lado; el 
olor ambiental; el color y la textura de la mesa; las sensaciones táctiles de la silla 


contra las piernas; el asiento, el respaldo, etcétera, Si tuviéramos que responder a 


todos los estímulos de la situación la conducta sería desorganizada y caótica. Los . 


mecanismos de sensibilización y habituación ayudan a reducir la, reactividad a los 
estímulos irrelevantes y a canalizar la conducra.a través.de acciones organizadas. y 


dirigidas. que son una. respuesta.a.sólo. algunos. de los .esríimulos que se experi- 
mentan: .. 

Los procesos de habituación y sensibilización son tan fundamentales para el 
: ajuste del organismo al ambiente, que se dan en todas las especies y en todos los 
-- sistemas de respuesta (para una revisión reciente, véase Peeke y Petrinovich, 1984). 
Hémos discutido en detalle tres ejemplos. Existen otros muchos casos de habitua- 
ción y sensibilización en la experiencia humana normal. Por ejemplo, la mayoría 
de las personas que tienen un reloj de pared no advierten su sonido cuando da las 
horas o los cuartos. Están completamente acostumbradas a él. De hecho, es más 
probable que noten cuándo no da un sonido habitual. En cierto modo, esto es una 
pena, ya que probablemente compraran el reloj por la belleza de su sonido. De 
forma similar, la gente que vive en calles muy transitadas, cerca de las vías del 
tren o al lado de un aeropuerto puede llegar a habituarse a los ruidos que, con 
frecuencia, penetran en sus casas. Sin embargo, las personas que van de visita a la 
casa es probable que sean sensibles a todos esos ruidos y que les resulten 
molestos. 

Conducir un coche implica estar expuesto a toda una serie de estímulos auditi- 
vos y visuales complejos. Cuando una persona se convierte en un experto conduc- 
tor se habitúa a los numerosos estímulos irrelevantes para la conducción como 
pueden ser el color y la estructura de la carretera, el tipo de postes de teléfono que 
están alineados a los lados de la carretera, ciertas sensaciones táctiles del volante y 
ciertos sonidos del motor. La habituación a las señales irrelevantes es particular- 
mente notable durante los viajes largos. Si se conduce sin parar, durante varias 
horas, es probable que uno se vuelva inconsciente a todos aquellos estímulos irre- 
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levantes para mantener el coche en la carretera. Si uno se cruza con un accidente 
o llega a una nueva ciudad, es probable que «se despierte» y preste atención otra 


vez a las diversas cosas que había estado ignorando. El pasar por delante de un 


accidente o llegar a otra ciudad es un estímulo activador que cambia el estado de 
uno y sensibiliza diversas respuestas de orientación que previamente estabaa 
habituadas. 

Si uno ha llevado alguna vez a casa un perro o un gato que eran pequeños, lo 
más normal es que el animal estuviera muy agitado y llorara mucho los primeros 
días. Esto ocurre porque la mayoría de los estímulos ambientales nuevos son 
eficaces para provocar respuestas. En cuanto el perro o el gato se acostumbran al 
nuevo hogar —es decir, en cuanto se habitúan a los muchos estímulos de la 
situación—, dejan de agitarse y se vuelven menos activos. Los seres humanos 
experimentan efectos similares. Si alguien visita un lugar nuevo o se encuentra 
con personas con las que nunca ha tratado, es probable que preste atención a toda 
una serie de estímulos que normalmente se ignoran. Si una persona llega a un 
edificio que no conocía, es posible que busque señales en las paredes, esforzándose 
por encontrar el lugar al que tiene que ir. Dejamos de responder a esos detalles 
en los lugares que nos resultan familiares, hasta el punto de que podemos ser 
incapaces de describir ciertas características sobresalientes, como el color de algu- 
nas paredes o el tipo de tirador que lleva una puerta que usamos todos los días. 


Análisis neurológicos de la habstuación y la sensibilización 


La sensibilización y la habituación han atraído la atención de mumerosos 
investigadores interesados en las bases neurológicas del aprendizaje debido a que 
estos dos fenómenos suponen las formas más simples de modificación de la con- 
ducta elicirada. Vamos a describir uno de los modelos neurofisiológicos destacados 
acerca de la habituación y sensibilización. Sin embargo, antes de hacerlo, es 
importante distinguir entre habituación y otros procesos que pueden también 
disminuir la probabilidad de que un estímulo provoque una respuesta. 


Diferencias entre babstuación, adaptación sensorial y fatiga. Como ya adver- 
timos, en muchas situaciones la respuesta elicitada inicialmente por un estímulo 
deja de darse cuando el estímulo se repite con frecuencia. Esta disminución de las 
respuestas es una de las características que identifica a la habituación. Sin 
embargo, no todos los ejemplos en que la repetición de un estímulo da lugar a un 
descenso de las respuestas supone habituación. Como ya discutimos anterior- 
mente, cualquiera que sea el estímulo elicitante hay tres hechos que tienen lugar. 
Primeramente el estímulo activa uno de los órganos de los sentidos, como los ojos 
o los oidos. Este proceso genera impulsos neurológicos sensoriales que son tras- 
mitidos al sistema nervioso central (la médula espinal y el cerebro). Desde allí los 
mensajes sensoriales son trasmitidos a los nervios motores. Los impulsos neuro- 
lógicos de los nervios motores, a su vez, activan los músculos que realizan la 
respuesta observable. La respuesta elicitada no será observable sí por : alguna 
razón los órganos de los sentidos se vuelven en temporalmente 1 insensibles a la esti- 
mulación. Una persona puede quedarse ciega “temporalmente por 1 un destello de 
_luz, for ejemplo, o o una pérdida temporal de audición por una exposición 
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repetida a un ruido fuerte. A esa disminución de sensibilidad se le llama adapra- 





ción sensorial. La respuesta refleja también dejará de producirse si los músculos . 


que intervienen en ella no pueden, responder debido,a lacfáriga> La adaptación 
sensorial y la fatiga son impedimentos a la respuesta elicitada que se producen 
fuera del sistema nervioso, en los Órganos de los sentidos y en los músculos. 
Si se altera el proceso neuronal implicado en la conducta elicitada, la probabi- 
lidad de una respuesta también cambiará. Existen diferentes tipos de cambios en 
el sistema nervioso que pueden entorpecer o facilitar la transmisión de impulsos 
neuronales desde las neuronas sensoriales a las motoras. Se supone que en la 
habituación y sensibilización intervienen cambios neurofisiológicos de ese tipo. 
Así pues, la habituación es diferente de la adapración sensorial y de la fariga, En 





tt 


la_habituación, el sujeto deja de responder a un estímulo aunque siga siendo 
totalmente capaz de percibir el estímulo y de realizar los movimientos musculares 


A 


que requiere la respuesta. La respuesta 


impulsos neurológicos sensoriales no se trasmiten a las neuronas motoras. 
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S Teoría del proceso dual de la habituación y la sensibilización. Se supone que 
existen diferentes clases de procesos neurológicos subyacentes responsables de los. 
aumentos y disminuciones de la disposición para responder a la estimulación. 
Existe un tipo de cambio en el sistema nervioso que conlleva una reducción de la 


a A 


capacidad del estímulo para producir una respuesta. Tal cambio se llama proceso 
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de habrruación. Otra clase de cambio en el sistema nervioso produce. aumentos 


en la disponibilidad para responder. A ese cambio se le llama proceso de sensibi- 
lización, En una situación determinada estos dos tipos de procesos pueden ocurrir 
simultáneamente. El resultado que finalmente se observe dependerá de qué pro- 
ceso sea más fuerte. El gráfico de la izquierda en la figura 2.9 ilustra una situación 
hipotética en que las repeticiones de un estímulo fortalecen el proceso de habitua- 
ción más que el de sensibilización. El efecto neto de esos cambios en la respuesta 
elicitada es un descenso a lo largo de las pruebas (efecto de habituación). El 
gráfico de la derecha ilustra el resulrado contrario: las repeticiones de un estímulo 
fortalecen el proceso de sensibilización más que el proceso:de habituación, y el 
resultado es un aumento en la respuesta elicitada a lo largo de las pruebas (efecto 


APARTADO 2.1 La habituación de los pensamientos obsesios 


El principio de la habituación se utiliza, a menudo, en la terapia de conducta para el 
cratamiento de los pensamientos recurrentes problemáticos. Muchas personas se preocu- 
pan por sus «malos» pensamientos, como ideas blasfemas o considerar que otras personas 
son gafes. Estos pensamientos tienden a suscitar una gran ansiedad. Rachman (1978) ha 
propuesto que tales pensamientos obsesivos se consideren como estímulos nocivos a los 
que el individuo no está habituado. El tratamiento, por tanto, consiste en hacer que el 
individuo piense continuamente en esas cosas «malas» hasta que se habitúe la respuesta de 
ansiedad. Los procedimientos de este tipo se suelen llamar «tratamientos de exposición 
prolongada» porque el paciente, con la ayuda del terapeuta, se expone a las ideas proble- 
máticas durante largos periodos. En un primer momento, el procedimiento da lugar a ua 
aumento de la ansiedad. Conforme continúa la exposición, la ansiedad, tal como la percibe 
el paciente, disminuye (véase Emmelkamp, 1982b). Basándose en diversos estudios con 
resultados comparables, Emmelkamp (1982a) ha concluido que para los pensamientos 
obsesivos, el tratamiento de exposición prolongada es, sin duda, un éxito. 





deja de darse porque, por alguna razón, los 
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de sensibilización). Así pues, los cambios en la conducta elicitada que finalmente 
se producen en una situación concreta equivalen al efecto neto de los procesos de 


habituación y de sensibilización. o 0 

“—" Basándose en investigaciones neurofisiológicas, Groves. y. Lhompson. ( 1970; 
véase también Thompson y otros, 1973) sugirieron que los _procesos de sensibili- 
zación y habituación tenían lugar en partes distintas del sistema nervioso. Supo- 
nían que los procesos de habituación ocurren en Jo que.ellos Hlarnaron el sistema 
E-R__Estos sistemas, formados por las vías neurológicas más cortas, conectan los 
órganos de los sentidos, estimulados por el estímulo elicitante, con los músculos 
que intervienen en la respuesta elicitada. (El sistema E-R. puede. considerarse 
igual que el arco reflejo.) Por el contrario, se supone que los procesos de sensibili- 
zación ocurren en lo que se llama sistema de estado. En él están implicadas otras 


A 4 


parres del sistema nervioso que determinan el nivel, general de sensibilidad del 


organismo, o su disponibilidad para responder. El sistema de estado permanece 
relativamente inactivo durante el sueño, por ejemplo. Las drogas estimulantes o 


depresivas pueden alterar el funcionamiento del sistema de estado, cambiar la 


a .— 


sensibilidad. También las experiencias emocionales pueden alterar el sistema de 
estado, El nerviosismo que acompaña al miedo está originado por la sensibiliza- 
ción del sistema de estado. Así pues, el sistema de estado determina la disponibi- 


ade 


lidad del.animal para responder, mientras que. el sistema.E-R capacita al animal 
para dar las respuestas específicas desencadenadas..por.los estímulos, de la situa- 


ción. Los cambios conductuales observados reflejan las acciones combinadas de 
esos dos sistemas. E 


Variación en la magnitud de respuesta 





Ensayos Ensayos 


Figwra 2.9.—Datos hipotéticos que ilustran la teoría del proceso dual de habituación y sensibilización. 

Las líneas discontinuas indican la fuerza de los procesos de habiruación (H) y sensibilización (S) a lo 

largo de los ensayos. La línea continua indica el efecto neto de los dos procesos. En el cuadro de la 

izquierda (A), a medida que transcurren los ensayos, el proceso de habituación se hace más fuerte que 

ei de sensibilización, y esto provoca una disminución progresiva de las respuestas. En el cuadro de la 

derecha (B), es la sensibilización la que se va haciendo más fuerte que la habituación, lo que conduce a 
un incremento progresivo de las respuestas. 
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lo del tubo influía sólo e 
habituación. La interprcración viscema E-R y, por tanto, activaba los procesos de 
resulta al , e los resultados cuando el estímulo era la tetina 
bebés q ado plicada, La tetina es un estímulo más poderoso para los 
incluso al comienzo del q e IIUetroS, y provocaba una succión mucho más fuer te, 
presentar la tetina de £ perímento. Los aumentos en la succión que ocurrían al 

etina de forma repetida pueden ser explicados considerando que el 


La teorí 
ta del proceso dual es consecuente con los efectos de habituación y 


sensibilizació 
ción que se detectaron en la reacción de sobresalto de las ratas 


figura 2. : . 
Lev ¿ujetos fueron sometidos a pruebas con ruidos de fondo 
les pudiera activar. Por ), no existía en la situación prácticamente nada que 
mentados usado, a : tanto, podemos suponer que los procedimientos experi- 
ciones repetidas del o Ujeron cambios en el Sistema de estado. Las presenta- 
iema E-R, y daban como me o e pa resalio A plemente activaban el sis- 
Sin . lación de la respuesta de sob 
O o el resultado contrario cuando se usó con los animales pe 

( ). En este caso se daban reacciones de sobresalto cada 


responsable del aumento en la reacción de sobresalto 

ara int ; : 

miento de La los cambios que se producen en las llamadas de agrupa- 

eso de a DInzones ante un búho disecado €s Necesario recurrir tanto al pro- 

después a 1zación como al de habituación. Estos pájaros primero aumentan 
inuyen sus llamadas de agrupamiento. A parentemente, el búho dise- 


Los análisis anteri 1 
errores sobre la succió 1 
tan varias características importantes O ento resal 
a ría del proceso dual. € 
vIo, el sistema de estad s lo a E 
o y el sistema E-R se acti ¡ 
ls ran de forma dif : 
Mir : erente 
, pecición de un estímulo. El sistema E-R se activa cada vez que un escalo 
, o o 
respuesta porque es el circuito neurológico que conduce los impulsos 
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desde los receptores sensoriales a los efectores de la respuesta. El sistema de 
estado interviene sólo en circunstancias especiales. En primer lugar, un hecho 
extraño (por ejemplo, un ruido de fondo intenso) puede aumentar la atención del 
sujeto y sensibilizar el sistema de estado. En segundo lugar, el sistema de estado 
puede sensibilizarse con las presentaciones repetidas del estímulo si el estímulo es 
suficientemente intenso o significativo para el sujeto (la retina en contraposición 
al tubo de goma, por ejemplo). Si el estímulo intenso se presenta con una fre- 
cuencia suficiente, de manera que las sucesivas presentaciones ocurran mientras el 
sujeto todavía permanece sensibilizado por la presentación anterior, se observa- 
rán aumentos progresivos en las respuestas. 
La teoría del proceso dual de la habituación y la sensibilización ha tenido gran 
influencia en el estudio de la plasticidad de la conducta elicitada, aunque no ha 
sido capaz de explicar con éxito todos los fenómenos de habituación y sensibiliza- 
ción. Una de las contribuciones importantes de la teoría ha sido la asunción de 
que la conducta puede estar fuertemente influida por hechos neurofistológicos que 
tienen lugar fuera del arco reflejo implicado directamente en esa respuesta elici- 
tada concreta. La teoría del proceso dual sostiene que el sistema de estado modula 
la actividad de los arcos reflejos. La idea básica de que ciertas partes del sistema 
nervioso sirven para modular los sistemas E-R que intervienen más directamente 
en la conducta elicitada, ha sido más ampliamente desarrollada en otros modelos 
más recientes de la habituación y la sensibilización (por ejemplo, Davis y File, 
1984). (Para una discusión detallada de varias teorías recientes sobre la habitua- 
ción, véase Stephenson y Siddle, 1983.) 


CARACTERÍSTICAS DE LA HABITUACION Y LA SENSIBILIZACION 


Se han realizado numerosas investigaciones para determinar de qué manera 
influyen distintos factores en los procesos de habituación y sensibilización. Las 
características de la habituación y sensibilización no son perfectamente uniformes 
en todas las especies y sistemas de respuesta. Sín embargo, poseen muchas cofnci- 
dencias. Vamos a describir algunas de las más importantes. 


El curso temporal de la babituación y la sensibilización 


La mayoría de los cambios de conducta que vamos a describir en capítulos 
posteriores se mantienen durante largos períodos de tiempo (un año o más). De 
hecho, ésta es una de las características que defínen el proceso de aprendizaje 
(véase capítulo 1). No todos los ejemplos de habituación y sensibilización poseen 
esa característica, y, por tanto, no todos los ejemplos de habituación y sensibiliza- 
ción se pueden considerar propiamente ejemplos de aprendizaje. 


El curso temporal de la sensibilización. Los procesos de sensibilización tie-.. 


nen, por lo general, efectos temporales. Aunque en algunos casos la sensibiliza- 


ción persiste durante varias semanas (por ejemplo, Kandel, 1976), en la mayoría 
de las situaciones el aumento de la disposición a responder es de corta duración. 
De hecho, el carácter temporal de un aumento en las respuestas puede servir para 
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identificarlo como un fenómeno de sensibilización. Efectos de sensibilización dife- 
rentes pueden mantenerse por espacios de tiempo diferentes. Davis (1974), por 
ejemplo, investigó con ratas el efecto de sensibilización por exposición a un ruido 
fuerte (80 dB) durante veinticinco minutos. Como era de esperar, el ruido fuerte 
.sensibilizó la respuesta de sobresalto ante un tono. Sin embargo, este aumento de 
receptividad persistió sólo hasta diez-quince minutos después de que se supri- 
miera el ruído fuerte. En otros sistemas de respuesta la sensibilización se disipa 
mucho más rápidamente. Por ejemplo, la sensibilización del reflejo de flexión de 
la pata posterior de los gatos dura sólo unos tres segundos (Groves y Thompson, 


ars” 


de la sensibilización está determinada por la intensidad de los.estímulos sensibili- 


A 


zadores. Cuanto más intensos son estos estímulos, más aumenta la disponibilidad 


a responder y mayor es la duración de los efectos de la sensibilización. 


El curso temporal de la babituación. La habituación también tiene una dura- 
ción variable, En la sensibilización, las diferencias temporales del efecto normal- 
mente reflejan sólo diferencias cuantitativas en los mismos mecanismos subya- 
centes. Sin embargo, parecen existir dos-tipos de efectos de habituación «cualita- 
tivamente» diferentes. Un tipo.de habituación es.similar a. muchos. casos de 

“sensibilización donde el efecro se disipa. relativamente- deprisa, en segundos. o 
minutos. El otro tipo tiene una duración más larga y puede persistir durante 
¿uuchos días. Estos dos tipos de habituación fueron ejemplificados muy bien en un 
experimento sobre la respuesta de sobresalto en las ratas (Leaton, 1976). El estímu- 
lo de prueba fue un tono alto, agudo, que se presentaba durante dos segundos. En 
primer lugar se dejaba que los animales se acostumbraran a la cámara experimen- 
tal sin presentarles ningún tono. Cada rata pasaba después por una prueba indivi- 
dual, una vez al día durante once días, en la que se le presentaba el tono. 
Teniendo en cuenta el largo intervalo (veinticuatro horas) entre la presentación 
de los estímulos, se suponía que cualquier disminución en las respuestas produ- 
cida por la presentación del estímulo era un ejemplo del proceso de habituación 
de larga duración. El proceso de habituación transitorio (de corta duración) fue 
activado en la fase siguiente del experimento dando a los sujetos trescientas pre- 
sentaciones del tono, poco espaciadas (cada tres segundos). Por último, a los ani- 
males se les dio una sola presentación del tono uno, dos y tres días más tarde, 
para medir su recuperación de los efectos de la habituación a corto plazo. 
La figura 2.10 muestra los resultados. La reacción de sobresalto más intensa se 
observó la primera vez que se presentó el tono. Se dieron reacciones progresiva- 
mente menores durante los diez días siguientes. Como en esta fase los animales 
hacían la prueba una sola vez cada veinticuatro horas, la disminución progresiva 
de las respuestas indica que los efectos de la habituación a las presentaciones del 
estímulo continuaron a lo largo de todo el período de once días. Este proceso de 
habituación de larga duración no dio como resultado una pérdida completa del 
reflejo de sobresalto. Los animales todavía reaccionaron algo el día once. Por el 
. contrario, las reacciones de sobresalto cesaron rápidamente cuando se presentó el 
tomo cada tres segundos en la siguiente fase del experimento. Sin embargo, esta 

ME: pérdida de disposición a responder sólo fue temporal. Cuando los animales pasa- 
ME: ron la prueba con el tono, uno, dos y tres días después, la respuesta de sobresalto 
¿ recobró el nivel del día once. Esta recuperación ocurrió simplemente porque se 





1970). Sin embargo, en todos los sistemas de respuesta la duración de los efectos 
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Figura 2.10.—Respuesta de sobresalto producida en ratas 


, r la presentació 
día en Fase 1, cada 3 seg. en Fase 2, y una vez al ene o 


día en Fase 3, (Según Leaton, 1976.) 


había dejado de 
resentar el to ñ : Po 
p e no durante un período largo de tiempo (verinticua- 


tro horas) y se le llamá recu 16 a 
eración E ú 

la característica 1d TICA. La Jecuperación.es pontánea es 
Po neaaca que apeñtilica el efecto de habituación a.corto plazo o temporal 
Lo A tios repetidas de un estímulo no siempre producen ¿mbos ¿fec. 
Tí bara E a a corto plazo y de larga duración —. Con el reflejo de Hexión de 
ela A 20s gatos únicamente se observó el éféctó de habituación a corto plazo 
E o y Spencer, 1966). En tales casos, la recuperación espontánea hace que 
A EcIons de.muevo totalmente ante el estímulo elicitante si se le deja un 
Peroco cs cescanso largo después de la habituación, Por el contrario, la recupera. 
có. =ponténes no £5 nunca completa en situaciones que tambiér implican efec- 

Dele 12b1tuación a largo plazo, como en el experimento de Leaton. Como mues- 
tra la figura 2.10, la respuesta de | 


i / sobresalto se recuperó en la última fase 
O Sin embargo, aunque así sea, los animales no dieron una no 
uerte al tono como la primera vez que se les presentó. 

Potas teorias pueden explicar las diferencias cualitativas entre los efectos d 
ec a corto y a largo plazo. La teoría del proceso dual, descrita ee 
E o ormuló Principalmente 'para explicar sólo los aspectos temporales de 

vación y la sensibilización. Las diferencias que existen entre los mecani 
mos de los efectos de habituación a corto y a largo plazo se tratan con ple 


una reciente teoría conductual sobr J ¡ 
e procesamiento de la informació é 
Whitlow y Wagner, 1984). AS 
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La especificidad para el estímulo de la habituación y la sensibilización embargo, la serie de estímulos a los que un animal se puede sensibilizar por una 
A descarga no es ilimitada. La sensibilización por una descarga no aumenta la reac- 





Se considera que los. procesos. de. habituación. son enormemente específicos tividad de las ratas a nuevos estímulos de sabor. La reactividad a nuevos sabores 
para un estímulo,repetirivo:-Una respuesta que se ha habituado a un estímulo se sensibiliza por un malestar interno, sensación opuesta al dolor cutáneo (Miller 
puede ser évocada con toda su fuerza por un nuevo estímulo elicitante. Por ejem- y Domjan, 1981). Parece ser que existen sistemas de sensibilización diferentes 
plo, después de que una persona se ha habituado totalmente al sonido de su reloj para la estimulación exteroceptiva e interoceptiva. 


de pared, si el reloj se estropea y empieza a emitir sonidos nuevos es muy proba- 
ble que de nuevo le preste atención. Después de producirse una habituación com- 


. pleta de la respuesta de orientación a un estímulo, es probable que la respuesta El efecto de los estímulos extraños intensos 
aparezca con su fuerza normal siempre y cuando el estímulo que se le presente pe 
sea suficientemente novedoso. La especificidad para un estímulo caracteriza todos C Como ya advertimos antes, un cambio en la naturaleza del estímulo elicitante 
los ejemplos de habituación y se ha considerado, por tanto, una de las característi- á puede producir la recuperación de una respuesta habituada. Sin embargo, ésta no 
cas definitorias de la habituación (Thompson y Spencer, 1966). « es la única manera de restaurar rápidamente las respuestas después de la habitua- 
Aunque los efectos de la habituación son siempre específicos para un. estí- bn La respuesta habituada puede también restablecerse sensibilizando al sujeto 


mulo, puede producirse alguna generalización de los efectos. Si alguien está habi- 

tuado a un sonido concreto del reloj de pared puede también responder a otro 
-- reloj de pared que sea sólo ligeramente diferente del primero. A este fenómeno se o 
> Te denomina generalización de!-estímulo de la habituación. Conforme aumentan | 


mediante la exposición a un estímulo extraño intenso. Á este fenómeno se le 
« llama deshabituación. En la figura 2.11 se muestran los resultados de un experi- 
“fento de deshabituúación. La reacción de sobresalto de las ratas fue suscitada repe- 
di e elesumilo mero el escala al e e . ti te a través de presentaciones breves de un tono. Al principio, la reacción 
lis diferencias entre el estimulo nuevo y el estímulo a] que se estaba habituado, la. A E i e e E e 50 a a peas 
reacción del sujeto se va pareciendo más a la respuesta que se daba cuando no < A F9ESp produjo 1 : 
existía habituación ms se repetía la presentación del tono. .(Vimos un modelo similar de cambio de res- 
d : id E ¡ ¡ igu 8.) El proceso 
En contraste con el proceso de habituación, la sensibilización es menos especí- puesta en las llamadas de agrupamiento ES E ag figura e ) El pl oce 
fica”para “el estimulo. Si un animal llega” por“cialquier motivo a activarse o a de habituación parecía haber acabado alrededor de la bn. a Doa 
a pe AE SL , . , S 
sensibilizarse, su reactividad aumentará para una variedad de estímulos. El dolor Justo antes de la prueba 15, la mitad de las ratas fueron sensibilizadas mediante la 





ñ . o. . . .. 
administrado a las ratas de laboratorio en una pata con una descarga eléctrica exposición a un resplandor de luz breve Y brillante Ae produjo una IEC APEracIon 
aumenta la reactividad de estos animales a las claves auditivas y visuales. Sin notable de la reacción de sobresalto habituada. Los animales respondieron al tono : 

APARTADO 2.2. Disponibilidad para la respuesta sexual y cambio de estímulos ! 


Figura 2.11.—Deshabituación de 
la respuesta de sobresalto ante 
un tono. Primero, se habituó la 
respuesta mediante repetidas pre- 
sentaciones del tono (ensayos 1-14). 
Antes del ensayo del 15 tono la 
mitad de los sujetos fueron ex- 
puestos a un breve destello de 
luz, lo cual causó una recupera- 
ción temporal de la reacción de 
sobresalto ante el tono (véase en- 
sayo 15). (Según Groves y Thomp- 
son, 1970.) 


El acto sexual va seguido frecuentemente por un descenso de la disponibilidad a res- 
ponder sexualmente. Las ratas macho y los cobayas, por ejemplo, no se excitan con una 
hembra inmediatamente después de aparearse con ella. Sin embargo, este descenso de la 
disponibilidad a responder es específica para la hembra que participa en el apareamiento. 

Si se introduce una hembra nueva, es probable que el macho se vuelva sexualmente activo, 

Á este efecto se le llama a veces «efecto Coolidge» después de una anécdota relacionada 

con el presidente Coolidge y su esposa. La historia cuenta que el presidente Coolidge y su 

mujer marcharon por separado a dar una vuelta por una granja avícola. Cuando la señora 

Coolidge vio a uno de los gallos le preguntó al guía cuántas veces al día se apareaba. : 
Impresionada por la gran cantidad de veces que lo hacía, le pidió a uno de sus ayudantes s 
que se asegurara de que este hecho llegase a oídos del señor Coolidge. Cuando el señor 

Coolidge supo de la frecuente actividad sexual del gallo, preguntó si éste siempre se apa- 

reaba con la misma hembra. Le contestaron que, obviamente, lo solía hacer con gallinas 

diferentes. Satisfecho con la respuesta, el presidente rogó que la señora Coolidge fuera 

igualmente informada de este extremo. 

El hecho de que se recupere la disponibilidad a responder sexualmente cuando se z 6 
introduce una nueva hembra tiene gran aplicación para la cría de ganado. Por ejemplo, 2 . 6 o a. 
para la inseminación artificial de las vacas es conveniente obtener de los toros grandes Ensayos 
cantidades de semen. La disponibilidad a responder de los toros baja si se les presenta de 
forma repetida la misma vaca o el mismo modelo de vaca. Se puede recoger mucho más 
semen si se utilizan varias vacas o distintos modelos de vaca (Hale y Almquist, 1960). 


Destello de luz 


Respuesca de sobresalto 
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mucho más en la prueba 15 que en las anteriores. Sin embargo, el efecto de 
sensibilización fue de corta duración. Las respuestas al tono volvieron al nivel de 
habituación en las pruebas 16 y 17. 

Es importante recordar que con deshabituación nos referimos a la recupera- 


- 


e, Pa AE a a PA q uo A > 
ción de la respuesta a un estímulo qué previamente había sido habituado. La 


fTgura Z.11 muestra sólo las reacciones de los animales a las presertaciones repe- 
tidas del tono. Carece de interés conocer el tipo de respuesta que los animales 
dieron al estímulo deshabituador (el destello de luz). El propósito del experi- 
mento era ver de qué manera la exposición a un destello de luz deshabituadora 
cambiaba la respuesta del animal al estímulo auditivo original. 


El efecto de la intensidad y frecuencia del estímulo 





Los efectos de la sensibilización y la habituación están estrechamente. relacio-. 
nados. can.la jotensidad y frecuencia del estímulo elicitante. (Lx frecuencia de un 
, a a e Ad A ir z > " Ñ A Ln 
mulo es el número de presentaciones del estímulo en un tiempo determinados” 


e 


estímulo es el número de present A TA e pa s ic 
cómo un segundo, por ejemplo.) Debido a la importancia que tienen la intensidad 
y frecuencia de un estímulo para la habiruación y sensibilización, muchos investi- 
gadores se han interesado por estas variables. Los estudios realizados han propor- 
cionado un patrón de resultados bastante complejo. Los resultados observados 
dependen del sistema de respuestas investigadas, de la clase de estímulos y de los 

rocedimientos que se hayan usado en la prueba. Por lo general, es más probable 


e produzca un aumento de las, respuestas (sensibilización) cuando el estímulo 
presentado repetidamente es muy.intenso. Además, con los estímulos intensos se 
A Ae po ] ; 

da una mayor sensibilización conforme se incrementa la frecuencia del estímulo 
(por ejemplo, Groves, Lee y Thompson, 1969). Por el contrario;—predominan los 
fenómenos de habituación cuando el estímulo que se repite es relativamente débil. 
Además, la tasa de habituación aumenta conforme se incrementa la frecuencia del 
estímulo débil, porque con. presentaciones frecuentes de'un estímulo débil tam- 
bién hay que añadir los efectos del proceso de habituación a corto plazo (véase 
figura 2.10). Los procesos de habituación a largo plazo no se facilitan con el 
umento de la frecuencia de las presentaciones de un estímulo. De hecho, existen 


, * pruebas de que una mayor frecuencia en la estimulación provoca una menor habi- 
tuación a lazo E 


or ejemplo, Davis, 1970). Teniendo en cuénta que las 
presentaciones repetidas de un estímulo pueden activar tanto los procesos de 
sensibilización como los procesos de habituación a corto y largo plazo, los efectos 
de la intensidad y frecuencia de un estímulo en una situación determinada depen- 
derán. del efecto. combinado de estos, diferentes procesos._Por esta razón, es a 
menudo difícil predecir para una situación concreta qué efecto van a tener los 
cambios en la intensidad y frecuencia del estímulo. 


LOS CAMBIOS EN LAS RESPUESTAS EMOCIONALES COMPLEJAS 


Hasta el momento hemos discutido la forma en que la repetición de un estí- 
mulo elicitante orígina cambios en los sistemas de respuesta relativamente sim- 
ples. Sin embargo, numerosos estímulos producen en el organismo efectos mucho 
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más complejos que las respuestas de sobresalto u orientación. Un estímulo puede 
evocar amor, miedo, euforia, terror, satisfacción, incomodidad, o una combinación 
de estas emociones. En esta sección vamos a describir el modelo estándar de las 
emociones evocadas por estímulos complejos activadores de la emoción, y cómo 
las repeticiones del estímulo alteran este modelo de respuestas emocionales. Estos 
temas han sido desarrollados de la forma más sistemática por la teoría del pro- 
ceso oponente de la motivación, propuesta por Solomon y sus colaboradores 
(Hoffman y Solomon, 1974; Solomon, 19777 "Solomon y Corbit, 1973, 1974). 
Vamos a describir esta teoría y sus consecuencias... ... 


La teoría de la motivación del proceso oponente a 

¿Qué sucede cuando se presenta un estímulo activador de la emoción y luego 
se retira? Considérense, por ejemplo, las reacciones de una adolescente a la que se 
le deja por primera vez un coche. Al principio se pondrá muy contenta y excitada. 
La excitación se irá apaciguando conforme pase el tiempo. No obstante, seguirá 
contenta. Si después de un día o dos ya no puede disponer del coche, sus emocio- 
nes no volverán a la neutralidad. Lo más probable es que poco después de devol- 
ver el coche lo eche de menos. Esta añoranza irá desapareciendo gradualmente. 

Es obvio que los diferentes estímulos activadores de la emoción provocan 
tipos diferentes de respuestas emocionales. Sin embargo, todos los patrones de 
cambios emocionales parecen tener ciertas características comunes. Solomon y sus 
colaboradores han llamado a estas características patrón estándar de la dinámica 
afectiva (Solomon y Corbit, 1974). Los elementos clave de este modelo se mues- 
tran en la figura 2.12. La aparición del estímulo activador de la emoción, como 
puede ser recibir un coche, suscita una respuesta emocional intensa (alegría), que 


Figura 2.12.—Patrón estándar de 
la dinámica afectiva. (Según So- 
Pico de la reacción lomon y Corbit, 1974.) 
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rápidamente alcanza su punto máxzmo. Esta reacción extrema va seguida de una 
fase de adaptación, durante la cual la respuesta emocional disminuye un poco 
hasta alcanzar un nivel de equilibrio. El estímulo (el coche) continúa produciendo 
emoción (alegría) durante el estado de equilibrio. Cuando cesa el estímulo 
(cuando la adolescente tiene que devolver el coche), el estado emocional se trans- 
forma rápidamente y aparecen unos sentimientos contrarios a los que se produ- 
cian en presencia del estímulo. La adolescente ya no está contenta y anhela el 
coche. Esta inversión del estado emocional, llamada postrreacción afectiva, decae 
gradualmente a medida que el sujeto vuelve a su estado normal. 

¿Cómo reacciona una adolescente una vez que la experiencia de manejar un 
coche se convierte en una rutina? Si una persona ha tenido muchas veces ocasión 
de manejar un coche, recibir un coche no le provocará una alegría igual de 
intensa que a la persona que lo experimenta por primera vez. El conseguir un 
coche le producirá probablemente sólo una reacción suave. Sin embargo, si en ese 
momento el coche no está a su disposición, se le creará un malestar y una año- 
ranza más intensos que la primera vez. En el momento que alguien se ha acos- 
tumbrado a tener un coche, su falta le originará un malestar intenso. Así pues, el 
patrón de cambios emocionales producidos por un estímulo activador de emocio- 
nes al que se estaba habituado es diferente del modelo estándar de la dinámica 
afectiva. Este patrón habituado se muestra en la figura 2.13. El estímulo suscita 
solamente una respuesta emocional suave. Sin embargo la postrreacción afectiva 
es mucho más fuerte que en el patrón estándar. 


Fsprra 2.13, —Patrón de los cam- 
bios afectivos ante estímulos ha- 
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Mecanismos de la teoría del proceso oponente 


¿Qué mecanismos subyacentes producen el patrón estándar de la dinámica 
afectiva y las modificaciones de este patrón con la habituación al estímulo? La 
teoría del proceso oponente de la motivación sostiene que los mecanismos neuro- 
fisiológicos que intervienen en la conducta emocional actúan para mantener la 
estabilidad emocional. Así pues, la teoría del proceso oponente es una teoría 
homeostática. Según esta teoría, una función importante de los mecanismos que 
controlan la conducta emocional es minimizar las desviaciones de la neutralidad 
(o estabilidad) emocional. (El concepto de homeostasis ha sido muy importante 
en el análisis de la conducta. Discutiremos otras teorías homeostáticas en capítu- 
los posteriores.) 

¿Cómo pueden mantener la estabilidad y neutralidad emocional los mecanis- 
mos neurofisiológicos? Mantener cualquier sistema en un estado estable o neutral 
requiere que una perturbación que fuerce al sistema a salir de la neutralidad se 
encuentre con una fuerza opuesta que contrarreste esa perturbación. Pensemos, 
por ejemplo, en unos niños intentando mantener nivelado un balancín. Si uno 
empuja hacia abajo un extremo del columpio, el otro extremo se levanta. Para 
mantener nivelado el columpio, una fuerza que empuje hacia abajo se tiene que 
encontrar con una fuerza opuesta que mantenga elevado ese extremo. El concepto 
de fuerzas o procesos contrarios que sirven para mantener un estado estable es 
esencial para la teoría del proceso oponente de la motivación. Esta teoría sostiene 
que un estímulo que despierta una emoción saca de la neutralidad al estado emo- 
cional de la persona. Se supone que esa desviación de la neutralidad emocional 
desencadena un proceso oponente que contrarresta la desviación. Los patrones de 
comportamiento emocional que se observan inicialmente y después de una amplia 
experiencia con el estímulo, son atribuidos a distintos aspectos del proceso opo- 
nente y al momento en que éste se produzca en relación con el momento en que 
ocurre la perturbación emocional primaria. Se puede suponer que el proceso opo- 
nente es algo esencialmente ineficaz. Va a la zaga de la perturbación emocional 
primaria y sólo después de una práctica repetida resulta eficaz para contrarrestar 
la perturbación primaria. 

La teoría del proceso oponente sostiene que la presentación de un estímulo 
activador de emoción suscita inicialmente lo que se ha llamado proceso primario 
o proceso «a», que es el responsable de la calidad del estado emocional (alegría, 
por ejemplo) que se verifica en presencia del estímulo. Se supone que, a su vez, el 
proceso «a» O proceso primario provoca un proceso oponente o proceso «b», 
que origina la reacción emocional contraria (descontento, por ejemplo). Siguiendo 
esta teoría, los cambios emocionales observados, cuando se presenta un estimulo y 
después se retira, reflejan el resultado neto del proceso primario y el proceso 
oponente. La intensidad del proceso oponente se resta de la intensidad del pro- 
ceso primario, dando lugar a las emociones que de hecho aparecen. 

La figura 2.14 muestra la influencia del proceso primario y el oponente en la 
forma del patrón estándar de la dinámica afectiva. Cuando el estímulo se presenta 
por primera vez, el proceso «a» aparece sin encontrar oposición por parte del 
proceso «b». La reacción emocional primaria puede, por tanto, alcanzar su punto 

más alto, El proceso «b» se activa entorices y empieza a oponerse al proceso «a». 
El proceso «b» reduce la intensidad de la respuesta emocional primaria y es res- 
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A Figura 2.14, —Mecanismo del 
proceso oponente que origina el 
patrón estándar de dinámica afec- 
tiva. (Según Solomon y Corbit, 


Respuesta 1974.) 
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ponsable de la fase de adaptación del modelo estándar. La respuesta emocional 
primaria alcanza un estado de equilibrio cuando los procesos «a» y «b» han lle- 
gado cada uno a su máxima intensidad durante la presentación del estímulo. 
Cuando el estímulo se retira, el proceso «a» cesa rápidamente, en cambio el pro- 
-ceso «b» permanece un tiempo. Así pues, el proceso «b» no tiene ahora nada a 
que oponerse. Por tanto, las respuestas emocionales características del proceso 
oponente se hacen evidentes por primera vez. Esas emociónes son, habitual- 
mente, contrarias a las observadas durante la presencia del estímulo. 

La suma de los procesos primario y oponente explica satisfactoriamente el 
patrón estándar de la dinámica afectiva. ¿Cómo cambian esos procesos subyacen- 
tes en el curso de la habituación a un estímulo activador de la emoción? Como 
vimos en la figura 2.13, después de una exposición prolongada a un estímulo 
activador de la emoción, el estímulo deja de provocar reacciones emocionales 
intensas, y la postrreacción afectiva se hace mucho más fuerte cuando cesa el 
estímulo. La teoría del proceso oponente explica este resultado asumiendo sim- 
plemente que el proceso «b» se fortalece al exponerse de forma repetida a un 
estímulo. El fortalecimiento del proceso «b» se refleja en varias de sus caracterís- 
ticas. El proceso «b» se activa más rápidamente una vez presentado el estímulo, 
su intensidad máxima aumenta, y desciende más lentamente cuando cesa el estí- 
mulo. Por el contrario, se supone que el proceso «a» permanece inalterable. En 
conclusión, después de la habituación el proceso oponente 'se opone con más 
fuerza a las respuestas emocionales primarias. Este efecto de la habituación 
reduce la intensidad de las respuestas emocionales primarias que se observan 
durante la presentación del estírmualo activador de la emoción. Y también da lugar 
a una excesiva postrreacción afectiva cuando se retira el estimulo (véase figura 
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A Figura 2.15.—Mecanismo del pro- 

ceso oponente que provoca los 

cambios afectivos ante estímulos 

habituados. Según Solomon y 
Corbit, 1974.) 
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Ejemplos de procesos oponentes 


El amor y el apego. Las reacciones de un adolescente, descritas arriba, son 
sólo un ejemplo de los mecanismos del proceso oponente. Las parejas humanas 
pueden experimentar cambios similares. Los recién casados están normalmente 
muy entusiasmados y se muestran muy cariñosos uno con otro cuando están jun- 
tos. Esta reacción emocional primaria sufre habituación conforme pasan los años. 
Gradualmente, la pareja se va asentando y llega a mantener una cómoda relación 
que carece del entusiasmo de la luna de miel. Sin embargo, esta habituación de la 
reacción emocional primaria va acompañada de un fortalecimiento de la post- 
rreacción afectiva, Cuanto más tiempo haya pasado junta una pareja peor se sen- 
tirán cuando se separen, y más durará su malestar («la distancia aumenta el 
cariño»). Después que una pareja ha vivido junta varias décadas, es muy probable 
que la muerte de uno de ellos cause gran aflicción al que sigue vivo. Esta fuerte 
postrreacción afectiva es llamativa, sobre todo si se tiene en cuenta que, a esas 
alturas de su relación, la pareja puede haber dejado de mostrar signo alguno de 
afecto. E 

Entre padres e hijos se dan efectos emocionales semejantes. Los hijos que han 
vivido con sus padres mucho tiempo dejan de mostrar amor o afecto hacia ellos, 
Cuando los adolescentes mayores, o los adultos jóvenes, están dispuestos a mar- 
charse de su casa, es más probable que se quejen de sus padres y no que los 
alaben. Este estado emocional representa la habituación de la reacción afectiva 
primaria. A pesar de que los hijos no muestren de forma abierta el cariño hacia sus 
padres, es probable que cuando se trasladen sientan nostalgia. Los padres también 
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echarán de menos a los hijos. Este estado representa la postrreacción afectiva. 
Tanto para los padres como para los hijos, los muchos años de convivencia sirven 
para fortalecer la postrreacción afectiva que acompaña a una separación. 

Las predicciones de la teoría del proceso oponente en relación con el amor 
humano y el apego no han sido probadas experimentalmente. Sin embargo, la 
investigación o suministra un soporte firme para la teoría en el área del 
apego y de la separación (véase Hoffman y Solomon, 1974; Mineka, Suomi y DieLi- 
z¡0, 1981; Starr, 1978; Suomi, Mineka y Harlow, 1983). 


El paracaidismo. El paracaidismo es un deporte muy poco corriente, con el 
que algunas personas disfrutan enormemente. Aquellos que mo practican este 
deporte se extrañan de que'otros lo encuentren divertido. Por supuesto poco hay 
de divertido en dar el primer salto. Las personas inexpertas invariablemente se 
asustan al saltar desde uf avión. Los estudios han mostrado que en ese momento 
presentan una activación fisiológica máxima, y sus expresiones faciales indican 
que están aterrorizados. Esta es la reacción emocional primaria al salto. Cuando 
los saltos se repiten, la reacción afectiva primaria se habitúa, mientras el proceso 
oponente se fortalece. Como la reacción emocional primaria es el terror, la res- 
puesta oponente es el júbilo. En los saltadores muy expertos el proceso primario 
queda anulado por el proceso oponente y no se aterrorizan con el salto. El fortale- 
cimiento de la reacción oponente es también evidente en su postrreacción afectiva 
cuando llegan al suelo. Los saltadores expertos están eufóricos y exultantes cuando 
tocan tierra y estos sentimientos positivos pueden durarles varias horas. De hecho, 
la postrreacción afectiva es mucho más agradable que el salto mismo y puede 
suponer la mayor parte del placer derivado del salto (Epstein, 1967). 


La drogadicción. Muchas drogas se toman principalmente por sus efectos 
emocionales. En muchos casos, los cambios emocionales que se producen con la 
primera y las posteriores administraciones de la droga están descritos con preci- 
sión por la teoría del proceso oponente de la motivación (Solomon, 1977). La 
teoría del proceso oponente predice que las drogas psicoactivas producirán un 
efecto emocional bifásico las primeras veces que se tomen. Cuando la droga es 
activa se experimenta un conjunto de respuestas emocionales (la respuesta afec- 
tiva primaria), y cuando la droga desaparece, tienen lugar las emociones opuestas 
(postrreacción afectiva). Estos cambios bifásicos son evidentes con distintas dro- 
gas psicoactivas, como el alcohol, los narcóticos (como la heroína), las anfetami- 
nas y la nicotina. La secuencia de efectos del alcohol es muy conocida. Poco des- 
pués de tomar la droga, la persona se encuentra tranquila y relajada porque la 
droga es básicamente un sedante. La postrreacción oponente se manifiesta en 
dolores de cabeza, náuseas y otros síntomas de la resaca. En el caso de las anfeta- 
minas, la droga crea sentimientos de euforia, bienestar, autoconfianza, insomnio y 
un sentimiento de control de la situación. Después de pasado este efecto, la per- 
sona se suele sentir fatigada, deprimida y amodorrada. | 

La teoría del proceso oponente predice que cuando el consumo de la droga es 
frecuente, la respuesta emocional primaria se debilita y la postrreacción oponente 
se fortalece. La habituación de las reacciones primarias a la droga es un ejemplo 
de tolerancia a la droga, en el que el efecto de la droga desciende con la repeti- 
ción de las dosis. A los consumidores habituales de alcohol, nicotina, heroína, 
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cafeína y otras drogas mo les afecta tanto la ingestión de la droga como a los 
novatos. La cantidad de alcohol que a un bebedor accidental le pondría un poco 
achispado, es probable que no tenga ningún efecto ea el bebedor habitual. Los 
bebedores habituales tienen que consumir mucho más alcohol para tener las 
mismas reacciones que los bebedores novatos. Las personas que fuman muchos 
cigarrillos, por ejemplo, rara vez obtienen mucho placer al hacerlo. El declive de 
la reacción primaria a la droga va acompañado de un crecimiento en la postrreac- 
ción oponente. Asimismo, los consumidores habituales de droga experimentan 
«resacas» mucho más fuertes cuando se les termina la droga que los consumidores 
novatos. Una persona que, por ejemplo, deja de fumar cigarros, se volverá irrita- 
ble, ansiosa y tensa, y tendrá un sentimiento general de insatisfacción. Cuando 
alguien que bebe mucho deja de tomar alcohol es probable que tenga alucinacio- 
nes, pérdida de memoria, agitación psicomotriz, delirsum tremens, y Otras pertur- 
baciones fisiológicas. En los consumidores habituales de anfetamina, la fatiga y la 
depresión que sigue a los efectos primarios de la droga puede ser tan fuerte que 
de lugar al suicidio. 

Si los efectos placenteros primarios de una droga psicoactiva desaparecen en 
el caso de los consumidores habituales, ¿por qué continúan tomándola?, ¿por qué 
son adictos? La teoría del proceso oponente sugiere que la drogadicción es, fun- 
damentalmente, un intento de reducir la aversión producida por la postrreacción 
afectiva a la droga —el mal «cuelgue», el «bajón» de las anfetaminas, la irritación 
que sobreviene cuando no se tiene el cigarrillo de costumbre—. Hay dos maneras 
de reducir la postrreacción aversiva de las drogas. Una es aguantar el tiempo 
suficiente para que se disipe. Es lo que se conoce por «pasar el mono». En los 
grandes consumidores el «mono» puede durar mucho y ser doloroso: La post- 
rreacción oponente puede eliminarse mucho más rápidamente sí se tgma la droga 
de nuevo. Esto reactivará el proceso primario y cortará los sufrimientos de la 
abstinencia. Muchos adictos no están «atrapados» por el placer que se deriva 
directamente de la droga. Más bien toman la droga para reducir los dolores de la 
abstinencia. 


COMENTARIOS FINALES 


Los animales y las personas no viven aislados. Viven en un ambiente físico y 
social complejo que determina casi cada aspecto de su actividad. La calidad de vida 
y la supervivencia misma dependen de una coordinación intrincada de la conducta 
con las complejidades del ambiente. La conducta elicitada representa una de las 
formas fundamentales que tienen los animales y las personas para ajustarse a los 
acontecimientos ambientales. 

Como ya se ha visto, la conducta elicitada adquiere muchas formas, desde los 
reflejos simples, mediados únicamente por tres neuronas, hasta las reacciones 
emocionales complejas. Aunque la conducta elicitada se produce como reacción a 
un estímulo, no debe ser considerada rígida e invariable. De hecho, una de las 
características relevantes de la conducta elicitada es que, a menudo, su forma varía 
según la situación. En algunos casos, la conducta elicitada está guiada por claves 
retroalimentadoras de la respuesta. Si un estímulo elicitante no activa al orga- 
nismo, la presentación repetida del estímulo elicitará respuestas progresivamente 
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más débiles. Este patrón representa el fenómeno de la habituación. Si el estímulo 
elicitante es particularmente intenso o es muy significativo para el sujeto, las 
presentaciones repetidas activarán al organismo y le conducirán a reacciones pro- 
gresivamente más intensas. Este patrón es característico del fenómeno de la 
sensibilización. 

Cualquier acontecimiento ambiental activará los procesos de habituación y 
sensibilización en diversos grados. La intensidad de respuesta que se observe es 
reflejo del efecto neto de la sensibilización y la habituación. Por lo tanto, si desco- 
nocemos las experiencias anteriores del organismo es imposible predecir lo 
intensa que va a ser la reacción provocada por un estímulo concreto. 

Las presentaciones repetidas de un estímulo elicitante producen cambios, 
tanto en las respuestas simples como en las reacciones emocionales más comple- 
jas. Los organismos tienden a minimizar los cambios en el estado emocional pro- 
vocados por los estímulos externos. Según la teoría del proceso oponente, de la 
motivación, las respuestas emocionales estimuladas por un acontecimiento exter- 


nó se contrarrestan en el organismo mediante un proceso. oponente. Se. supone. 
que este proceso compensatorio u oponente se fortalece con cada nueva aparición, 
dando lugar a una reducción de las respuestas emocionales primarias si el estímulo 
se repite con frecuencia. El fortalecimiento del estado emocional oponente resulta” 


evidente cuando se suprime el estímulo. 

La habituación, la sensibilización y los cambios de intensidad del proceso opo- 
nente son los mecanismos más simples por los que el organismo ajusta sus reac- 
ciones a los acontecimientos ambientales en base a la experiencia previa. 
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Capítulo 3 
EL CONDICIONAMIENTO CLASICO: 
FUNDAMENTOS 


El capítulo 3 trata sobre los conceptos y procedimientos fundamenta- 
les en otra forma básica de aprendizaje, el condicionamiento clásico. Las 
investigaciones sobre condicionamiento clásico comenzaron con el tra- 
bajo de Pavlov. Desde entonces, las investigaciones se han ampliado a 
una gran variedad de organismos y sistemas de respuestas. Vamos a 
describir varios procedimientos importantes en el estudio del condicio- 
namiento clásico e introduciremos el concepto de relación de señal. 
Algunos procedimientos de condicionamiento clásico provocan el apren- 
dizaje de nuevas respuestas a un estímulo, mientras que el resultado de 
otros es aprender a retener o imhibir respuestas. Vamos a describir 
ambos tipos de procedimiento, y a discutir también la forma en que se 
extingue el aprendizaje. Por último, discutiremos varios ejemplos y apli- 
caciones de condicionamiento clásico. 


PAVLOV Y LOS PRIMEROS AÑOS DEL CONDICIONAMIENTO 
CLASICO 
EL PARADIGMA DEL CONDICIONAMIENTO CLASICO 
SITUACIONES EXPERIMENTALES 
El condicionamiento del parpadeo en los conejos 
El condicionamiento del miedo 
El seguimiento del signo 
El aprendizaje de aversión al sabor 
EL CONDICIONAMIENTO PAVLOVIANO EXCITATORIO 
Procedimientos del condicionamiento excitatorio 
Medición de la respuesta condicionada 
Eficacia de los procedimientos de condicionamiento excitatorio 
El condicionamiento simultáneo 
El condicionamiento de demora corta 
El condicionamiento de huella 
El condicionamiento de demora larga 
El condicionamiento hacia atrás 
Los procedimientos de control en el condicionamiento clásico 
LA CONTIGUIDAD Y LAS RELACIONES DE SEÑAL ENTRE LOS 
ESTIMULOS CONDICIONADO E INCONDICIONADO 


Ejemplos de relaciones de señal | 
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La contingencia EC-El 
EL CONDICIONAMIENTO PAVLOVIANO INHIBITORIO 
Procedimientos para el condicionamiento imbibitorio 
El procedimiento estándar para la inhibición condicionada 
La inhibición diferencial 
La contingencia negativa del EC-El 
La medida de la inhibición condicionada 
Los sistemas de respuestas bidireccionales 
La prueba del estímulo compuesto o prueba de la sumación 
La prueba del retraso en la adquisición 
LA EXTINCION 
La extinción y la habituación 
Qué se aprende en la extinción 
APLICACIONES DEL CONDICIONAMIENTO CLÁSICO 
La digestión 
El control de la sensibilidad al dolor 
La supresión del sistema inmune — 
Aversión a la comida en los humanos 
La terapia de aversión al alcohol 
La conducta emocional 
El condicionamiento clásico y el desarrollo de las fobias 


La terapia de conducta para ee muedos y la ansiedad 
COMENTARIOS FINALES 
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En el capítulo anterior empezamos una discusión sobre los principios de la 
conducta describiendo la conducta elicitada y la modificación de la conducta elici- 
tada a través de la habituación y de la sensibilización. Estos procesos, relativa- 
mente simples, permiten a los organismos ajustar su conducta a un amplio aba- 
nico de desafíos ambientales. Sin embargo, silos animales dispusieran sólo de los 
mecanismos ; comportamentales descritos en el capítulo 2, la cantidad de cosas que 
podrían hacer quedaría muy limitada. Por ejemplo, no podrían aprender a dar 


respuestas totalmente nuevas a los estímulos, respuestas que jamás se darían 
como reacciones innatas a esas claves. Tampoco podrían aprender las relaciones 
entre los estímulos. ambientales. 

Aprender a dar respuestas nuevas a los estímulos puede tener, sin duda, gran- 
des ventajas. El mundo está en continuo cambio, y los mecanismos innatos de 
respuesta no se adaptan tan flexiblemente a los desafios que.esos cambios plan- 
tean como los mecanismos de aprendizaje. Los animales pueden salir beneficiados 
en muchas ocasiones si aprenden a responder de una forma mueva cuando se 
encuentran con estímulos nuevos o con estímulos familiares en contextos nuevos. 
Igualmente importante es la capacidad de aprender las relaciones entre distintos 
estímulos. Los hechos que tienen lugar en el mundo no ocurren aislados ni al azar 


«respecto de otros hechos. Una..eelación causa/efecto.dentro del ambiente asegura 


con bastante fiabilidad que unos hechos preceden a otros. El motor del coche no 
arranca a menos que se encienda; no oleo traspasar el umbral de una casa a 
menos que la puerta esté abierta; no llueve a no ser que haya nubes en el cielo. 
Las instituciones sociales y las costumbres también nos aseguran que los hechos 
ocurren en un orden predecible. Las clases se programan en un orden previsible; 
podemos calcular lo que nos podemos llevar de una tienda antes de pagar; pode- 
mios predecir si alguien va a mantener una conversación con nosotros por la 
forma en que nos ha saludado. Aprender a pronosticar acontecimientos ambienta- 
les y aprender a responder basándonos en tales predicciones constituye un aspecto 
muy importante de ajuste comportamental al ambiente. Imaginemos, por ejem- 
plo, la cantidad de problemas que tendríamos si nunca pudiéramos predecir el 
tiempo que nos va a llevar el hacer la comida, las horas en que están abiertas las 
tiendas, O si nuestro coche va a arrancar por las mañanas. 

El mecanismo más simple por el que los organismos aprenden a dar respues- 
tas nuevas a. Jos es estímulos de aprenden. las telaciones.. E los. estímulos . es.el . 





aprovecharse de la secuencia ordenada de. los hechos ap ea aprender qué. 
estímulos tienden a acompañara qué hechos. Sobre la base de este aprendizaje, 
los animales llegan a dar respuestas nuevas a los estímulos. Por ejemplo, el condi- 
cionamiento clásico es el proceso por el que los animales aprenden a aproximarse 
a las señales de comida y a salivar cuando están a punto de ser alimentados. 


También interviene en el aprendizaje de reacciones emocionales, como el miedo y 
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el placer ante estímulos que inicialmente no suscitaron esas emociones. Ántes de 
seguir discutiendo el papel del condicionamiento clásico en los animales y en el 
hombre en general, vamos a describir primero con detalle algunas de las investi- 
gaciones que nos han aportado lo que sabemos acerca del condicionamiento 
clásico. 


PAVLOV Y LOS PRIMEROS AÑOS DEL CONDICIONAMIENTO CLASICO 


El condicionamiento clásico se sigue asociando todavía hoy, cincuenta años 
después de su muerte, con el nombre y el trabajo de Ivan Pavlov. Pavloy comenzó 


sus investigaciones en Rusia a finales del siglo XIX. El fenómeno del condiciona- 
miento clásico fue también descubierto independientemente por Edwin B. Twit- 
myer, en 1902, en la lectura de su tesis doctoral que presentó en la Universidad de 
Pennsylvania (véase Twitmyer, 1974). Sin embargo, Twimyer no llevó a cabo un 


programa extenso de investigación, y sus hallazgos fueron ignorados durante 


muchos años. Aunque los escritos de Pavloy se difundieron ampliamente en los 


Estados Unidos, la crítica académica más minuciosa y la comprobación de sus 
ideas las realizaron por primera vez, en Polonia, Konorski y sus colaboradores 
(véase Konorski, 1948). 

Las investigaciones de Pavlov sobre condicionamiento clásico eran una pro- 
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longación de sus investigaciones sobre los procesos de la digestión. Gran parte de 


su trabajo sobre condicionamiento tenía relación con las acciones de las glándulas 





salivares. La mayoría de las personas asocian la digestión antes que nada con las 
actividades del estómago y de los intestinos. Sin embargo, la digestión empieza en 
la boca, donde la comida se mastica y se mezcla con la saliva. Así pues, las glándu- 
las salivares son las primeras glándulas que intervienen en la descomposición de 
la comida. Son unas glándulas grandes y tienen unos conductos cerca de la super- 


APARTADO 3,1. 1 P. Pavlov: breve biografía 


Nacido en Rusia en 1849 en el seno de la familia de un pastor religioso, Pavlov pasó su 
vida dedicado al estudio y a la investigación. Recibió su más temprana educación en un 
seminario local de teología y tenía planes de seguir una carrera religiosa. Sin embargo, su 
vocación cambió en seguida y a los veintiún años ingresó en la Universidad de San Peters- 
burgo, centrando sus estudios en la química y en la fisiología animal. Tras obtener el 
equivalente al grado de licenciatura, ingresó en la Academia Imperial Medicoquirúrgica en 
1875 para proseguir su formación en fisiología. Ocho años más tarde consiguió el docto- 
rado con una investigación sobre los nervios eferentes del corazón y después empezó a 
investigar diversos aspectos de la fisiología digestiva. En 1888 descubrió los nervios que 
estimulan las secreciones digestivas del páncreas, y este hallazgo le llevó a iniciar una serie 
de experimentos por los que recibió el Premio Nobel de Fisiología en 1904. 

Pavlov realizó gran cantidad de investigaciones originales mientras era estudiante uni- 
versitario, así corno después de recibir el doctorado. Sin embargo, no obruvo una plaza en 
la Facultad ni su propio laboratorio hasta 1890, cuando fue nombrado profesor de farmaco- 
logía en la Academia Medicomilitar de San Petersburgo. En 1895 se hizo profesor de 
fisiología en la misma institución, La mayor parte de la investigación por la que llegó a ser 
famoso la realizó después de recibir el Premio Nobel. Así pues, a diferencia de muchos 
científicos que realizan sus trabajos más creativos en los primeros afios de su carrera, 
Pavlov permaneció muy activo en el laboratorio hasta cerca de su muerte, en 1936. 
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ficie, que se pueden observar fácilmente. Los conductos de las glándulas submaxi- 
lares, por ejemplo, están situados a lo largo de cada lado del fondo de la boca, 
unos al lado de otros, liberando saliva cerca de los dientes inferiores. (Se pueden 
ver con claridad esos conductos mirando debajo de la lengua con un espejo.) Los 
conductos submaxilares pueden separarse fácilmente del tejido que les rodea. Se 
pueden extraer haciendo una incisión en el fondo de las bocas y luego coserlos con 
un punto a la superficie exterior de la piel. Con esta modificación quirúrgica, las 
secreciones de las glándulas se pueden recoger, medir y analizar (véase la figura 3.1). 

El interés inicial de Pavlov por las funciones digestivas estaba relacionado con 
temas puramente fisiológicos. Estaba interesado en los sistemas neurológicos res- 
ponsables de la salivación que provocaba la comida en los perros. Sin embargo, 
encontró que los perros que había utilizado en varios experimentos no esperaban 
para salivar a que se les colocara la comida en la boca: empezaban a salivar en 
cuanto veían la comida. Esta salivación anticipatoria le dificuitó el estudio de la 
salivación como respuesta a la comida. Si el perro se ponía a salivar antes de que 
se le presentara la comida, esta secreción no se podía atribuir fácilmente a la 
presentación de la comida. Enfrentados a ese problema, científicos menos astutos 
que Pavlov podrían haber restringido su investigación a animales menos habitua- 
dos a la situación experimental y que no producían una salivación anticipada. 
Pavlov, en cambio, redefinió los objetivos de su investigación y comenzó una .. 
extensa investigación acerca de los mecanismos que controlan la saliyación antici- 
patorja (Pavlov, 1927). 

¿Por qué los perros con una experiencia previa comienzan a salivar antes de 
recibirla comida? Uno de los primeros estudiantes de Pavlov que trabajó en el 
problema, Anton Snarsky, sugirió que la visión de la comida hacía que los perros 
pensaran en ella y esto producía una salivación anticipatoria, Pavlov rechazó esta 
interpretación por ser mentalista, y consideró, en cambio, la salivación anticipato- 
ria como la manifestación de una nueva respuesta refleja, provocada por el estímu- 





Figura 3.1—Diagrama de la preparación para el condicionarniento salivar pavloviano. Una cánula 
conduce las gotas de saliva desde el conducto salivar hasta un dispositivo de registro de datos. (Según 
Yerkes y Morgulis, 1909.) 


82 MICHAEL DOMJAN Y BARBARA BURKHARD 


la de.la comida. (Véase una explicación más detallada del descubrimiento de la 
respuesta condicionada en Boakes, 1984.) 

Si se asume que la salivación anticipatoria de los perros con una experiencia 
previa es una reacción a los estímulos que se presentaron emparejados con la 
comida, surgen entonces numerosas cuestiones experimentales. ¿Qué clase de 
estímulos pueden llegar a producir salivación? ¿De qué forma adquieren los estí- 
mulos la capacidad de provocar salivación? Los estímulos que llegan a producir 
una salivación anticipatoria, ¿pierden alguna vez esta función? ¿Pueden los ani- 
males aprender a inhibir, o suprimir, la salivación en respuesta a un estímulo, de 
la misma forma que pueden aprender a producirla? Pavlov dedicó la última parte 
de su carrera científica a responder a preguntas como éstas, y a lo largo de dicho 
proceso realizó gran cantidad de descubrimientos sobre los mecanismos del condi- 
cionamiento clásico. 


EL PARADIGMA DEL CONDICIONAMIENTO CLASICO 


La mayoría de las personas están familiarizadas con el procedimiento que 
Pavlov utilizó para estudiar la salivación anticipatoria. En el procedimiento inter- 
venían normalmente dos estímulos importantes, Uno de ellos era un ruido o una 
luz que se encendía. En su primera presentación, estos estímulos podían provocar 
una respuesta de orientación, pero no producían salivación. El otro estímulo de la 
situación fue la comida o el sabor de una solución ácida colocada en la boca. En 
contraste con el primer estímulo, el segundo provocaba no sólo movimientos de 
orientación, sino también una fuerte salivación, incluso la primera vez que se 


presentaba, Paylov se. .refirió:al-tono o a la luz como estímulo condicional debido | 


a que la capacidad de este estímulo para provocar salivación dependía. de (estaba 
condicionada a) que se preseñtara repetidamente junto a.la comida. Por el contra- 
rio, el estímulo dela comida. o-del sabor ácido fue denominado estímulo incondi- 
cional porque su capacidad para provocar salivación no dependía de que los suje- 
tos tuvieran un entrenamiento previo... Arla salvación producida eventualmente 


por él'tóno o la huz, se le llamó respuesta condicional, y a la salivación producida . 


siempre por la comida o el sabor ácido sé Te llamó respuesta incondicional. Así 
pues, los estímulos y respuestas cuyas propiedades y aparición no dependían de 
un entrenamiento previo fueron llamados incondicionales; a los estímulos y res- 
puestas cuyas propiedades y aparición dependían de un entrenamiento especial se 
les llamó «condicionales». 

En-la primera traducción al inglés de los escritos de Pavlov, el término ¿ncon- 
dicsonal fue traducido erróneamente como ¿incondicionado y el término condicio- 
nal como condicionado. El sufijo -ado estuvo utilizándose muchos años. Sin 
embargo, el término condicionado no capta con tanta precisión como el término 


“5% condicional el significado original que Pavlov le asignó de «dependiente de» 


(Gantt, 1966). Las palabras condicional e incondicional son más usuales en los 
escritos modernos sobre condicionamiento clásico y en la actualidad se emplean 
indistintamente éstas y condicionado e sncondicionado. Como los términos estíma- 
lo condicionado (e incondicionado) y respuesta condicionada (e incondicionada) 
son frecuentes en las discusiones sobre condicionamiento clásico, se suelen escri- 
bir abreviados. Estímulo condicionado y respuesta condicionada, EC y RC, respec- 
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Al 


tivamente, y estímulo incondicionado, respuesta. incondicionada, El y RI, res- 
pectivamente. 


- SITUACIONES EXPERIMENTALES 


El condicionamiento clásico ha sido investigado en una amplia variedad de 


situaciones y con diversas especies. Pavlov realizó la mayoría de sus experimentos 
con perros, usando la técnica de la cánula salivar. Sin embargo, este tipo de inves- 


tigación es bastante costoso. Por tanto, la mayoría de los experimentos actuales 

sobre condicionamiento pavloviano se llevan a cabo con ratas domesticadas, cone- 
+ » £ - A . 

jos y palomas. A continuación se describen algunas de las técnicas más conocidas. 


El condicionamiento del parpadeo en los conejos 


El paradigma del condicionamiento del parpadeo en los conejos fue desarro- 
llado por Gormezano (véase Gormezano, 1966; Gormezano, Kehoe y Marshall, 
1983). Se suelen utilizar conejos albinos. Gormezano los escogió para estudias la. 


respuesta de parpadeo porque los conejos.rara.vez parpadean si.na ha existido.un 
Fuente del soplo de aire 


3 Soporte de plástico 
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Figura 3.2.—Diagrama de la preparación para el condiciónamiento del parpadeo en el conejo. Un 
soplo de aire dirigido al ojo, o una leve descarga en la piel bajo el ojo, sirven como El. Los parpadeos 
son detectados por un potenciómetro. 
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entrenamiento especial. Por tanto, si se observa que el animal parpadea después 
e Trearcón de ua estímulo, puede casi asegurarse que la respuesta ocurrió 
a causa del estímulo, y que de otra manera no se hubiera producido. En los expe- 
rimentos de condicionamiento del parpadeo se coloca al conejo en un soporte de 
plástico, como muestra la figura 3.2. La cabeza del animal sobresale del soporte y 
se sujeta un extremo de hilo fino al párpado superior del ojo. El otro extremo del 
hilo va unido a un pequeño potenciómetro. Los movimientos del párpado produ- 
cen movimientos en el potenciómetro y éstos se transforman en señales eléctricas 
que permiten un registro preciso de las respuestas de parpadeo. El estímulo 
incondicionado es un soplo de aire en la superficie del ojo, o una breve descarga 
(de 1 seg, por ejemplo) en la piel de debajo del ojo. Los animales parpadean 
rápidamente como respuesta al El. Se han utilizado distintos estímulos como EC, 
entre los que se incluyen luces, tonos o la vibración del abdomen del animal con 
un aparato manual para masajes. 

En el experimento típico de condicionamiento, el estímulo condicionado se 
presentaba durante 500 mseg y terminaba con la aparición del estímulo incondi- 
cionado, El estímulo incondicionado da lugar a que los párpados se cierren fuerte 
y rápidamente. Cuando el EC se presenta emparejado con El de forma repetida, la 
respuesta de parpadeo también llega a darse con el EC. En el procedimiento 
normal, los investigadores registran en cada prueba si el parpadeo tiene lugar 
durante el EC, antes de que se presente el El Los datos se presentan en términos 
del porcentaje de ensayos en los que se observa la RC, considerando bloques de 
pruebas. 

El condicionamiento de parpadeo es, con frecuencia, un proceso relativamente 


mu 


.JEnto,. y aun en el caso de sujetos sometidos a un entrenamiento intenso no apare- 


cen respuestas condicionadas en todos los ensayos. La figura 3.3 muestra una 


tes y Gormezano, 1962.)' 
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Figura 3.3.— Curva típica del 
aprendizaje que se obtiene con 
el condicionamiento del párpa- 
do, (Según Schneiderman, Fuen- 
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curva de aprendizaje típica de condicionamiento del párpado. Los animales reci- 
bieron 82 ensayos de condicionamiento cada día. El octavo día de entrenamiento 
(656 ensayos), se dieron respuestas condicionadas en el 70 por 100 de los ensayos, 


aproximadamente. Cuando se producía respuesta condicionada, ésta ocurría inme- 
aran spués del comienzo del EC (antes de 523 milisegundos). En esos 
experímentos, los grupos de control, que no reciben el EC junto con el El, parpa- 


dean con la frecuencia natural: en menos del 5 por 100 de los ensayos. 


Figura 3.4.—(A) En este expe- 
rimento de supresión condicio- 
nada, la rata presiona una palan- 
ca de respuesta para obtener 
comida como recompensa, 
(B) Resultados de ua experimento 
de supresión condicionada con ra- 
tas (según Domjan, sin publicar). 
En cada uno de los tres días de 
adiestramiento se realizaron tres 
ensayos de condicionamiento. El 
EC era un estímulo audiovisual, y 
el El una breve descarga a través 
del suelo enrejado. Una rasa de 
supresión 0,5 indica que los suje- 
tos no dejan de apretar la palanca 
durante el EC. Una tasa de supre- 
sión de O indica una supresión 
total de la respuesta durante el EC. 
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a Plinio de sede grado de supresión de la respuesta producida por el estimulo condicionado se calcula 


L- 


El condicionamiento del miedo se estudia habitualmente con ratas y, más 
raramente, perros. En la mayoría de los experimentos, el estímulo aversivo 
incondicionado es una descarga eléctrica en los pies, enviada a través de un suelo 
metálico enrejado. La intensidad de la descarga es considerablemente mayor que 
la que se utiliza en el condicionamiento del parpadeo. El estímulo condicionado 
suele ser un tono o una luz que se enciende, y el miedo condicionado se mide 
indirectamente midiendo la forma en que el estímulo condicionado al miedo 
altera la actividad que está llevando a cabo el animal. 

Una técnica de medida indirecta del miedo condicionado se denomina proce- 
dimiento de la respuesta emocional condicionada (o supresión. condicionada), 
O 
que se abrevia REC procedimiento, ideado por Estes y Skifiner(1941), se ha 
utilizado desde entonces ampliamente en los estudios de condicionamiento pavlo- 
viano (Kamin, 1965). El animal más utilizado en los experimentos de supresión 
condicionada es la rata. A los animales, colocados en una cámara experimental 
pequeña, se les entrena primero a presionar una palanca para obtener comida 
como premio (véase figura 3.4). Tras un entrenamiento suficiente de presión de 
la palanca, llegan a presionar la palanca a un ritmo estable, obteniendo un premio 
de comida cada 2-3 min. La fase de condicionamiento clásico del experimento se 
inicía una vez que las respuestas de presión de la palanca han quedado bien esta- 
blecidas. La duración del EC es, por lo general, más larga que en el condiciona- 
miento del párpado de los conejos (3 min, por ejemplo), y asimismo, el El de 
descarga es normalmente más largo (5 seg, por ejemplo). El procedimiento típico 
de condicionamiento implica la presentación del El de descarga al final del estímu- 
lo condicionado. El intervalo entre pruebas suele ser de 15-a 30 min. 

Se hace evidente el progreso del condicionamiento del miedo cuando el estímu- 
lo condicionado desbarata la respuesta de presión de la palanca para obtener 
comida. Si el sujeto no se ha encontrado antes con el estímulo condicionado, la 
primera vez que éste se presenta puede aparecer una ligera desorganización de la 
respuesta de presión de la palanca. Si el EC no se presenta junto con la descarga, 
esa ligera supresión de la respuesta inicial se habitúa. Antes de 3 ó 4 ensayos, el 
EC no tiene efecto alguno en la conducta de la rata. Sin embargo, si el EC se 
empareja con la descarga en el pie, inmediatamente queda condicionado a la des- 
carga, y el animal suprime la respuesta de presión de la palanca en cuanto se 
presenta el EC. Si la intensidad de la descarga es eficaz, en 3 Ó 5 ensayos de 
condicionamiento, la supresión condicionada de las respuestas de presión de la 
palanca puede llegar a ser completa (Kamin y Brimer, 1963). Los animales pue- 
den no presionar la palanca en absoluto cuando se presenta el EC, La supresión 
de la respuesta, sin embargo, es específica para el EC. En cuanto cesa el EC, el 
animal reanuda la conducta premiada con comida. 

Quedarse paralizadas o heladas por el miedo es una de las reacciones innatas 


de las ratas ante los estímulos aversivos o temibles (Bolles, 1970). El procedi- 


miento del REC se diseñó para proporcionar una medida sensible de la supresión 
de la respuesta inducida por el miedo. (Bouton y Bolles, 1980: Mast, Blanchard 
y Blanchard, 1982). Como a los animales se les entrena para presionar la/ palanca a 
un ritmo estable y así obtener comida como premio, las desviaciones a partir de esta 
línea de base de respuesta pueden medirse fácilmente. La medida cuantitativa del 


normalmente dividiendo el número de respuestas de presión de la palanca que el 
sujeto da durante el EC por la suma del número de respuestas que da durante el 
EC, y las que da durante un periodo de tiempo igual de largo, antes de la presen- 
tación del EC. La fórmula es:- * 


h E Respuestas al EC 
Razón de supresión = 





Respuestas al EC-+ respuestas antes del EC 


Este índice tiene un valor de cero si el sujeto deja de presionar la palanca por 
completo durante la presentación del EC, porque el numerador de la razón es 
cero, En el extremo opuesto, sí la rata no altera en absoluto su ritmo de presión 
de la palanca cuando se presenta el EC, el índice adquiere un valor de 0,5. Se 
puede comfirmar esto considerando algunos casos hipotéticos. Por ejemplo, 
supongamos que el EC se presenta durante tres minutos y que en un período 
normal de tres minutos la rata da 45 respuestas. Si el estímulo condicionado no 
altera la conducta de presión de la palanca, el animal dará 45 respuestas durante 
el EC, de forma que el numerador de la razón será 45. El denominador será 45 
(las respuestas del EC) +45 (las respuestas anteriores al EC), es decir, 90. Por 
tanto, la razón será 0,5. Los valores de razón entre O y 0,5 indican grados decre- 
cientes de supresión de la respuesta, o de miedo condicionado. 

La figura 3.4 presenta una muestra de los resultados de un experimento de 
supresión condicionada con ratas. Se llevaron a cabo tres ensayos de condiciona- 
miento, cada uno de los tres días de entrenamiento. La primera vez que se pré- 
sentó el EC se produjo muy poca supresión de la respuesta, y durante el primer 
día de entrenamiento, no se registró una gran supresión. Sin embargo, se produjo 
un aumento sustancial de la supresión desde el último ensayo del día 1 (ensayo 3) 
hasta el primer ensayo del día 2 (ensayo 4). Con un entrenamiento continuado, 
las respuestas se iban suprimiendo gradualmente, hasta llegar a un punto en que 
el animal casi no presionaba la palanca cuando se le presentaba el EC. 


+ 


373 El seguimiento del signo A dd 


Las investigaciones de Pavlov se centraron en sistemas de respuesta como el 
de la salivación, que pueden considerarse sumamente reflejos. En esos sistemas la 
presentación del estímulo incondicionado es invariablemente seguida por una 
respuesta incondicionada característica, que también llega a ser elicitada por el 
estímulo condicionado cuando el EC y el El se emparejan de forma repetida. El 
trabajo de Pavlov motivó que durante muchos años se pensara que los procedi- 
mientos de condicionamiento clásico podían producir aprendizaje sólo en siste- 
mas sumamente reflejos. Los estudios de condicionamiento del parpadeo ejempli- 
fican este enfoque. De hecho, teniendo en cuenta que la respuesta de parpadeo 
ocurre con una latencia más corta y presenta menos variabilidad que la salivación, 
hay quienes consideran que éste es un paradigma para las investigaciones de con- 
dicionamiento clásico, incluso mejor que el del condicionamiento salivar (Amsel, 
1972). Esta conceptualización tan restringida de los procedimientos de condicio- 
namiento clásico no es habitual en los enfoques contemporáneos. El procedi- 
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miento de supresión condicionada, que se popularizó como técnica para las inves- 
tigaciones de condicionamiento clásico en los años sesenta, es responsable, en 
parte, de que los enfoques sean menos restringidos. Otro procedimiento para el 
estudio del condicionamiento clásico que ha ensanchado nuestra perspectiva del 


condicionamiento clásico es el que se denomina seguimiento del signo o auto- 
cmoldsamieato. (Hearst, 1975; Hearst y Jenkins, 1974). 


£ 


Los animales tienden a acercarse y contactar con aquellos estímulos que seña- 


f 


Cia 


lan la disponibilidad de, la comida. .En.el ambiente natural, la disponibilidad de . 


A 


comida viene indicada normalmente..por algún aspecto de la comida misma. Al 
áproximarsé y contactar con las señales de la comida; los 'ahimáles”se poñién, en 
realidad, en contacto con la comida. Para un predador, por ejemplo, la vista, los 
movimientos, el olor y quizá los ruidos de la presa son señales que indican la 
posibilidad de alimento. Siguiendo esos estímulos, es probable que el predador 
coja su presa. 

El seguimiento del signo se puede investigar en el laboratorio presentando un 
estímulo discreto y localizado, justo antes de cada entrega de una pequeña canti- 
dad de comida, El primer experimento de este tipo fue realizado por Brown y 
Jenkins (1968) con palomas. Los animales fueron colocados en una cámara expe- 
rimental con una pequeña tecla circular que se podía iluminar y que las palomas 
podían picotear (véase figura 1.1). A los animales se les daba periódicamente una 
pequeña cantidad de comida. Inmediatamente antes de cada entrega de comida, la 
tecla se iluminaba durante ocho segundos. Las palomas no tenían que hacer nada 
para que se presentara la comida. La comida se suministraba automáticamente 
después de cada iluminación de la palanca, independientemente de lo que el ani- 
mal hiciera. En caso de que los animales tuvieran hambre, se podía predecir que, 
cuando vieran la tecla iluminada, irían al plato de comida y esperarían la siguiente 
presentación de comida. 

Curiosamente, sin embargo, no fue esto lo que ocurrió. En vez de valerse de la 
luz para averiguar el momento de ir al plato de comida, las palomas comenzaron 
a picotear la propia tecla. Esta conducta era llamativa porque no se requería que 
picotearan la tecla para obtener comida en esta fase del experimento. 

A partir de este descubrimiento, se han realizado muchos experimentos acerca 
del fenómeno del seguimiento del signo utilizando gran variedad de especies y de 
estímulos no condicionados (véase, por ejemplo, Locurto, Terrace y Gibbon, 
1981). Algunos de ellos se van a describir en las páginas y capítulos siguientes. 
Estos experimentos han mostrado que el seguimiento del signo es una técnica 
muy útil para investigar la manera en que se aprenden. las asociaciones entre un 
estímulo. y.otro. En los experimentos de seguimiento del signo con palomas, el 
estímulo condicionado es la iluminación de una tecla, y el estímulo incondicionado 
es la presentación de comida. Como ocurre en otros procedimientos de condicio- 
namiento, se dá el aprendizaje más rápidamente cuando se presenta el EC justo 
antes del El, y el aprendizaje no tiene lugar si el EC y el El se presentan de forma 
aleatoria, uno respecto del otro (Gamzu y Williams, 1971, 1973). 

El seguimiento del signo para obtener un premio de comida se ilustra de 
forma espectacular en los ejemplos en que se coloca la señal lejos del sitio donde 
se suministra la comida. En un experimento de este tipo (véase Hearst y Jen- 
kins, 1974), se colocaron palomas en un corredor de 6 pies (182 cm) que tenía un 
plato de comida en medio (véase figura 3.5). Cada extremo del corredor tenía un 
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Figrra 3.5.—WVista superior de una «caja larga» usada en experimentos con palomas sobre seguimiento 


de una señal. Como estímulo condicionado sirve la iluminación de una tecla luminosa en un extremo 
de la cámara experimental, y la comida es entregada en el medio de la cámara. (Según Jenkins, 
mediante comunicación personal, 1980.) 


disco circular que se podía iluminar. La presentación de comida venía siempre 
precedida por la iluminación del disco de un extremo del corredor. El estímulo 
visual del extremo opuesto no estaba correlacionado con la comida. Es importante 
señalar otro aspecto del experimento. Una vez que se presentaba, la comida 
estaba disponible sólo 4 segundos. Por tanto, si el animal no iba al recipiente de 
la comida durante esos cuatro segundos, no conseguía comida en ese ensayo. 

Después de que se repetía varias veces la presentación de una luz encendida 
en un extremo del corredor junto con el suministro de comida, las palomas 
comenzaban a hacer una cosa bastante llamativa: en cuanto se encendía la luz 
corrían a ese extremo del corredor, picoteaban el disco iluminado y luego corrían : 
al centro del corredor a coger la comida. Como el corredor era muy largo, las 
palomas no siempre regresaban al plato de comida del centro antes de que des- 
apareciera. Esta conducta de seguimiento del signo resultaba sorprendente porque 
era totalmente innecesaria. Los animales no tenían que picotear el disco ilumi- 
nado para conseguir el premio de comida. Podían haberse sentado en medio del 
corredor y esperar simplemente su ración de cada ensayo. El hecho de que no lo 

hicieran, prueba la atracción que ejercen las señales condicionadas clásicamente 
cuando el premio es la comida. Por el contrario, los sujetos no se acercaron de 
forma constante a la luz del otro extremo de la caja, la cual no estaba correlacio- 
nada con las presentaciones de la comida (véase Boakes, 1979). 

El seguimiento del signo es también evidente en la conducta humana. Mucha 
gente mientras sube en el ascensor mira los números de los botones cuando se 
encienden indicando el piso por el que se está pasando. El hecho de mirar fija- 
mente los números de los pisos no hace que el ascensor llegue más rápido a su 
destino, exactamente igual que el picotear la señal de la comida en el experimento 
de la caja alargada no adelanta la obtención de comida. Los números del ascensor 
son signos de cuándo se van a abrir las puertas. Estimulan una conducta de 
«seguimiento» debido a su significación informativa. Las personas «siguen la. 

ista» de aquellos estímulos que suministran información acerca de unos hechos 
importantes y prometedores de la misma forma que las palomas siguen la ilumi- 
nación de la tecla que señala la presentación de comida. 
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El aprendizaje de aversión al sabor es otro de los procedimientos habituales 
para investigar el condicionamiento clásico. Aunque este procedimiento se conoce 
desde hace más de treinta años (véase Richter, 1953; Rzoska, 1953), no se popu- 
larizó como técnica para el estudio del condicionamiento clásico hasta los años 
setenta, cuando los trabajos de John García, James Smith, Paul Rozin, Sam 
Revusky y otros llegaron a ser bien conocidos (véase Barker, Best y Domjan, 
1977; Milgram, Krames y Alloway, 1977). La técnica del condicionamiento de 
aversión al sabor consistía en dar de beber a los animales una solución con sabor, 
y se hizo que enfermaran inyectándoles una droga o exponiéndoles a una radia- 
ción aversiva. Debido a que experimentan los efectos de la enfermedad tras la 
exposición al sabor, los animales adquieren una aversión al sabor. La preferencia 
por una solución con sabor y su ingestión voluntaria se suprimen con el trata- 
miento de condicionamiento. 

El aprendizaje de aversión al sabor es el resultado de presentar unidos el EC 
(en este caso un sabor) y el El (la inyección de la droga o la exposición a una 
radiación), exactamente igual que en otros muchos ejemplos de condicionamiento 
clásico. Cuando el aprendizaje de aversión al sabor todavía no se comprendía bien, 
se pensaba que esta modalidad de condicionamiento estaba regida por unas leyes 
de condicionamiento que no se aplicaban a situaciones de condicionamiento como 
las de parpadeo o salivación (véase Rozin y Kalat, 1971, por ejemplo). Muchas de 
las razones para mantener esta creencia no se sostienen a la luz de investigacio- 
nes más recientes (véase Domjan, 1980, 1983). Sin embargo, el aprendizaje de 
aversión al sabor difiere de otras situaciones de condicionamiento en algunos 
aspectos importantes. En primer lugar, se puede aprender una fuerte aversión al 


* sabor con el primer emparejamiento de sabor y enfermedad. Áunque el aprendi- 
zaje con un solo ensayo se observa también en el condicionamiento del miedo, el 


aprendizaje con un solo ensayo rara vez se observa, si es que se llega a observar, 
en el condicionamiento del parpadeo, en el condicionamiento salivar y en el 
seguimiento del signo. La segunda característica diferencial del aprendizaje de 
aversión al sabor es que el aprendizaje se produce aun en el caso de que el animal 


q 


: A = A A 
no se ponga enfermo hasta varias horas después de la exposición a un sabor 
nuevo. El intervalo entre el EC y el El en el condicionamiento del parpadeo, por 
ejemplo, es normalmente menor de un segundo porque se da muy poco condicio- 
namiento, si es que se llega a dar, cuando transcurre más tiempo entre los dos 


acontecimientos. Earcontraste-con-los.cortos intervalos entre EC-El que son nece- 


sarios en las.situaciones de. condicionamiento salivar, de miedo.y de seguimiento - 


del signo, los animales aprenden una aversión a una solución con. sabor aun en el 
caso de que el estímulo incondicionado mo se presente.en varias horas (García, 
Ervin y Koelling, 1966; Revusky y García, 1970). O 

Un experimento de Smith y Roll (1967) nos proporciona un buen ejemplo de 
aprendizaje de aversión al sabor con demora larga. Primero, se sometió a los anima- 
les a un programa de privación de agua, de forma que cuando se les colocaba agua en 
la jaula se la bebían en seguida. Un día que tenían sed, se les permitió que bebieran 
una solución de sacarina al 1 por 100 durante veinte minutos. Á continuación, entre 
cero y veinticuatro horas después de la presentación de la sacarina, grupos indepen- 
dientes de animales fueron expuestos a las radiaciones de una máquina de rayos X. 


e 


envenenada en subsiguientes ocasiones. Pa 
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Figuera 3.6.— Media del porten-. 
taje de preferencia por el sabor 
que acría de EC tras ser empare- 
Inofensiva jado con rayos X o con una ra- 
diación inofensiva, usando distin- 
ros intervalos EC-El. El porcen- 
taje de preferencia es el tanto 
por ciento de sacarina respecro 
al total de líquido ingerido por 
el sujeto. (Según Smith y Roll, 
1967.) 


Porcentaje de preferencia 





1 3 6 12 24 
Intervalo EC-El (horas) 


Los animales del grupo de control eran llevados también a la máquina de rayos X 
pero no sufrían radiaciones. A estas ratas se las denominó falsamente irradiadas. 
Transcurridas veinticuatro horas desde la- radiación o el tratamiento simulado, a 
cada rata se le dio a elegir entre sacarina o agua natural como bebida durante los 
dos días siguientes. La preferencia de cada grupo de animales por la solución de 
sacarina se muestra en la figura 3.6. Los animales que habían sido expuestos a la 
radiación seis horas después de probar la solución de sacarina mostraron una 
aversión profunda a la sacarina en la posterior prueba de condicionamiento. 
Bebieron menos del 20 por 100 del total de líquido que contenía el tubo con 
sacarina. Se observó mucha menos aversión en animales a los que se les irradió 
doce horas después de la exposición a la sacarina y apenas se observó aversión en 
ratas irradiadas veinticuatro horas después de la exposición al sabor. En contraste 
con este gradiente de evitación a la sacarina que se observó eñ ratas irradiadas 
todos los grupos falsamente irradiados prefirieron con mucho la solución de saca. 
rina. Bebieron más del 70 por 100 del total del líquido que contenía el tubo de la 
sacarina. 

El aprendizaje de aversión al sabor despertó mucha atención cuando se deseu- 
brió por primera vez que se podía dar aprendizaje en un solo ensayo y con demo- 
ras largas entre EC y El En una reflexión posterior, sin embargo, comprendemos 
que lo sorprendente sería que el aprendizaje de aversión al sabor no tuviera esas 
características. El aprendizaje de la aversión al sabor desempeña un papel esencial 
en la selección de la comida. Si los animales encuentran y comen comida envene-, 


Í . os . 
[ ada, se ponen enfermos. Aprendiendo una aversión, pueden evitar la comida : 


nvene 1 SUDSIguientes os ra suministrar una proteción grande, 
sin embargo, el aprendizaje tieñé que darse con largos intervalos entre EC y EL. 


- Con frecuencia las materias tóxicas de la comida no producen efectos perjudiciales 


hasta que la comida se ha digerido, ha sido absorbida por la sangre y distribuida a 
los distintos tejidos del cuerpo. Este proceso lleva su tiempo. Por tanto, si los 
animales no fueran capaces de asociar el sabor de las comidas inapropiadas con 
sus efectos dañinos retardados, no serían capaces de aprender a evitar materias 
alimenticias tóxicas. Aprender a evitar el veneno es especialmente importante 
para animales como las ratas. Las ratas toman alimentos muy variados y, por 
tanto, tienen muchas probabilidades de encontrarse con materiales tóxicos. 
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EL CONDICIONAMIENTO PAVLOVIANO EXCITATORIO 14 | Lo tiempo corto (menos de un minuto), y que el El se presenta durante el EC o 
inmediatamente después. - 

3. _ El condicionamiento de huella. El condicionamiento de huella es similar 
al procedimiento de dEmÓTa” COTE, Excepto que el El no se presenta hasta que el 
a. El intervalo entre el final del EC y el “principio del.El se llana 
intervalo de huella. 

: coñ dicionamiento Me demora larga. Este procedimiento también es 
similirapra ¡miento de condicionamiento de de demora.corta.en nel que. el EC 
precede al El. Sin embargo, en este caso el EC está presente e mucho. más HEnpo.... 
(cinco-diez..minuros)..antes. de. quese. presente. el..El. 

5. El condicionamiento bacia atrás. El último procedimiento representado 
en la figura 3.7 difiere de los. demás.eo.que. £LEC.se. presenta poco/después, en 


vez de antes, que. el EL. A esta técnica se le llama «condicionamiento hácia atrás». 


La modalidad de condicionamiento pavloviano con la que estamos más fami- * 
liarizados es la que se conoce técnicamente como condicionamiento excitatorio. 
Todos los ejemplos descritos arriba constituyen casos de condicionamiento excita- 
torio. ¿Durante el condicionamiento excitatorio, los s sujetos aprenden una nueva 
_JESPUÉSTA. al estimuló córidiciónado « que'és: congruente con el estímulo” o inicóndicio-,, 
nado. Los perros aprenden a salivar én tespiiesta a una campana qué precede a la 

cómida, los conejos aprenden a parpadear en respuesta a un tono que precede a 
una breve irritación de la piel que rodea el ojo, las ratas aprenden a paralizarse de 
miedo como respuesta a una luz o a un tono que precede a una descarga eléctrica 
dolorosa; las palomas aprenden a acercarse y picotear una tecla encendida que 
precede a la entrega de comida, y las ratas aprenden a evitar el beber la sacarina 
que precede a la enfermedad. En.zodos estos casos, y como resultado del empare- 
_Jamiento del.EC-y.el El, el. estímulo condicionado activa o «excita» una respuesta 
“condicionada que era coherente con elEL. “7 











: Medición de la respuesta condicionada 


Pavlov y otros posteriores a él han llevado a cabo investigaciones sistemáticas 
sobre procedimientos del tipo de los que se representan en la figura 3,7, para 
averiguar la forma en que el condicionamiento del EC depende de la relación 
temporal entre las presentaciones del EC y el El. Para hacer comparaciones sobre 


Ed . 
Y . E Procedimientos del condicionamiento excitatorio 


Uno de los factores más importantes que determinan el desarrollo del condi- 
cionamiento clásico en todas las situaciones descritas arriba es la relación. tempo- 
ral entre el estímulo condicionado y el estímulo incondicionado. Variaciones apa- 
rentemente triviales y pequeñas en la forma de emparejarse el EC con el El 
pueden tener efectos profundos en el ritmo y en la extensión del condiciona- 
miento clásico. En la figura 3.7 se muestra un diagrama de cinco procedimientos 
de condicionamiento que se han investigado frecuentemente. La distancia hori- 
zontal de cada diagrama representa el transcurso del tiempo, y los desplazamien- 
tos verticales representan la aparición y la terminación de un estímulo, Un. 
ensayo de condicionamiento es cada configuración entre EC y El, en la cual cada 
estímulo sólo se presenta una. vez. En un experimento típico de condicionamiento 
clásico pueden presentarse numerosos ensayos en una o más sesiones de entre- 
namiento. El intervalo entre los ensayos de condicionamiento se llama intervalo 

. €ntre ensayos, En contraste con esto, el. intervalo entre el comienzo. del EC y el 
comienzo del El dentro del ensayo de condicionamiento se llama intervalo entre 
estímulos o intervalo ] EC- El. El intervalo entre estímulos es siempre mucho más 
corto que el intervalo « entre ensayos. “En muchos experimentos el intervalo entre 
los estímulos es menos de un minuto, mientras que el intervalo entre los ensayos 
puede durar cinco minutos O más. Trowridsme DM al rd dar 0 

1, .El condicionamiento. simultáneo. La forma más obvia de. exponer a los 

sujetos al EC.emparejado .con el El es presentar los dos estímulos a la vez. Este 

"PiScedimiento, llamado «condicionamiento simultáneo», es el procedimiento 

representado en la figura 3.7. El carecer esencial de este procedimiento es que los 
pe estímulos condicionado e incondicionado se presentan al mismo tiempo. 

a 2. El condicionamiento de demora corta. El EC puede presentarse poco 

A después del El. Este procedimiento, llamado procedimiento «de demora corta», es 
la técnica que se usa con más frecuencia. El carácter esencial de este procedi- 


miento es que la aparición del EC precede a la aparición del El por un período de 


Tiern po —————————_———_—__-— Figura 3.7.—Cinco procedimien- 
ASAS uaeivade tos de condicionamiento clásico 


PA frecuentemente investigados. 
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la forma en que se produce el aprendizaje con diferentes procedimientos, hay que 
idear métodos para medir el condicionamiento del EC, Además este método debe- 
ría ser igualmente aplicable a todos los procedimientos. Una técnica consiste en 
medir la rapidez con que se produce la respuesta condicionada después de la 
presentación del estímulo condicionado. Esta medida de la fuerza de la respuesta 


se llama, latencia de la respuesta co 
tempo que transcurre entre la presentación del estímulo condicionado y la apari- 





..ción de la respuesta condicionada. 


ds A 


La medida de la latencia de la respuesta puede informarnos del desarrollo del 
condicionamiento solamente si la respuesta condicionada tiene lugar antes del El 
en ese procedimiento concreto de condicionamiento. Este puede : ser el caso de los 
procedimientos de demora corta, demora larga y condicionamiento de huella por- 


que en todos. esos.casos.la.respuesta condicionada puede empezar antes de que se 


presente el estimulo ¡ncondicionado.. Sin embargo, en los procedimientos de con- 
dicionamiento simultáneo y hacia atrás, la latencia de la respuesta no puede 
usarse como un índice de condicionamiento. [En esos casos la conducta observada 
durante el EC no se debe claramente sólo a la presencia del EC. Esto es así 
particularmente en el caso del condicionamiento simultáneo. Usando tal procedí- 
miento, cualquier conducta observada durante el EC podría haber estado suscitada 
por el El más que por el EC, ya que se presentan al mismo tiempo. En el condi- 
cionamiento hacia atrás, la conducta observada durante el EC puede haber sido 
provocada por el El que ocurrió antes del EC. De la misma forma, las medidas de 
latencia de la respuesta en los procedimientos de condicionamiento de demora 
corta, demora larga y de huella pueden no indicar el grado de aprendizaje que se 
ha producido si resulta que la respuesta condicionada no se materializa hasta 
después de la presentación del estímulo incondicionado. 
=> Una forma de evitar el problema descrito arriba es comprobar el grado de condi- 
cionamiento presentando periódicamente. el EC. solo. (sin el El). En ese caso, las 
respuestas provocadas por el EC pueden observarse sin la contaminación de las res- 
puestas provocadas por el El. Los ensayos con el¿EC solo que se introducen perió- 
dicamente para medir el alcance del aprendizaje se, llaman ensayos de prueba. 
Los ensayos de prueba permiten medir no sólo la latencia sino también otros 
aspectos de-la.respuesta condicionada. Cuando Pavlov estudiaba la salivación, por 
ejemplo, con frecuencia medía la cantidad de gotas de saliva que eran liberadas. 
Tales medidas de la intensidad de la respuesta se dice que reflejan la magnitud de 
la respuesta. Se puede también calcular el porcentaje de ensayos de prueba con el 
EC. solo.en.los.que.se.observa.pua respuesta condicionada, Esto proprociona un 
índice-de la probabilidad de la. respuesta. condicionada. 


Eficacia de los procedimientos de condicionamiento excitatorio 


Al usar ensayos de prueba y medidas de latencia, magnitud o probabilidad de 
la respuesta, se puede comparar la eficacia de los distintos procedimientos que se 
representan en la figura 3.7. Rara vez se han comparado los cinco procedimientos 
en el mismo experimento. Por otra parte, los resultados de las comparaciones que 
se han realizado, a veces difieren según el tipo de respuestas que se condiciona. 
Sin embargo, se pueden ofrecer algunas generalizaciones en base a las pruebas de 
que se dispone. 


a. La latencia es la cantidad de 
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t El condicionamiento simultáneo. La _presentación-del-E€-al.mismo-tiempo 
que.el Elirara. vez es eficaz para establecer la respuesta condicionada, Algunos 
investigadores han informado del éxito obtenido en el condicionamiento del 
miedo después de un pequeño número de ensayos de condicionamiento simultá- 
neo (por ejemplo, Burkhardt y Ayres, 1978; Mahoney y Ayres, 1976). Sin 
embargo, el condicionamiento simultáneo no es tan eficaz para condicionar el 
miedo como el condicionamiento de demora corta (Heth y Rescorla, 1973). Ade- 
más, en otros experimentos de condicionamiento clásico se ha encontrado que el 
condicionamiento simultáneo es totalmente ineficaz (por ejemplo, Bitterman, 
1964; Smith, Coleman y Gomerzano, 1969). 


ua 





EL 


miento de condicionamiento. de demora'cortá es el más eficaz para producir com-.. 


¡cionamiento excitatorio. Como ya advertimos antes, el intervalo entre el 
comienzo del EC y el comienzo del El se llama intervalo entre estímulos o inter- 
valo EC-El. En el condicionamiento simultáneo, el intervalo entre los estímulos 


es de.¿ero. segundos, Por lo general, a medida.que.aumenta el intervalo. EC-El el... 


condicionamiento mejora hasta un punto y después desciende (por ejemplo, Ost y 
Lauer, 1965; Shneiderman y Gormezano, 1964). 


El condicionamiento de huella. . En el procedimiento de demora corta, se pre-. 


senta el EC justo antes del El y se mantiene. hasta que.aparece. el. EL El procedi- 


miento del condicionamiento de huella es similar en el sentido de que aquí el EC 


también se presenta poco antes del El (véase la figura 3.7). Sin embargo, en el . 


a 


procedimiento de huella el. EC se termina poco antes de que aparezca el El. El que 
exista un intervalo de huella entre el EC y el El tiene un efecto significativo sobre 
el aprendizaje. El procedimiento.de-huella.es.con frecuencia menos eficaz que el 
procedimiento de demora para que se produzca un condicionamiento excitatorio 
(por ejemplo, Ellison, 1964; Kamin, 1965), y, en determinadas circunstancias, el 
procedimiento de huella enseña a los sujetos a inhibir o a retener la respuesta 
condicionada más que a ejecutarla (Hinson y Siegel, 1980; Kaplái, 1984): ” 


El condicionamiento de demora larga. Con los procedimientos de condicio- 
namiento de demora corta y de huella, a medida que el entrenamiento avanza, la 
magnitud de la respuesta condicionada aumenta, y su latencia disminuye. Curio- 
samente, sin embargo, esto no ocurre si se utiliza un intervalo más largo entre 
EC-El. Con.el condicionamiento de demora larga, a.medida que el animal empieza. 
a, aprender.la respuesta condicionada, la latencia se acorta sólo hasta un punto. 
Tras una extensa experiencia con este procedimiento, el animal da muestras de 


aprender que el El no se presenta haste un siempo después del comienzo del EC, .. 


y comienza a retrasar su respuesta condicionada hasta la presentación del El. 
Pavloy se refirió a esta retención de la respuesta condicionada al comienzo del 
EC, en el condicionamiento de demora larga, como inhsbición de la demora. La 
inhibición de la demora se ha observado en varios sistemas de respuesta, inclu- 
yendo el condicionamiento salivar y el del miedo (por ejemplo, Pavlov, 1927; 
Rescorla, 1967a; Williams, 1965). Sin embargo, no se ha investigado en algunos 
de los procedimientos de condicionamiento clásico desarrollados más reciente- 
mente, como el seguimiento del signo y el aprendizaje de aversión al sabor. 


El condscionamiento.de demora corta; En muchas situaciones, el procedi. 


dd € 
aa ao te 
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El condicionamiento hacia atrás. Los resultados de los estudios sobre el pro- 


cedimiento de condicionamiento hacia atrás SB CónA OS. Algunos investigadores 
han informado que se produce condicionamiento excitatorío cuando existe un 
emparejamiento EC y El hacia atrás (véase Shurtleff y Ayres, 1981; Spetch, Wil- 
kie y Pinel, 1981). Otros investigadores no han podido hallar condicionamiento 
excitatorio, y algunos, de hecho, han informado que los animales aprenden a 
suprimir, o inhibir, su conducta con un condicionamiento hacia atrás (por ejem- 


plo, Maier, Rapaport y Wheatley, 1976; Moscovitch y LoLordo, 1968; Siegel y 


Domjan, 1971). Algunas de las discrepancias. en los resultados parecen deberse al 
número de ensayos de condicionamiento que se llevaron a cabo. Es más probable 


que se observe condicionamiento excitatorio después de pocos ensayos de condi- 
cionamiento; y condicionamiento imbibitorio después de, un condicionamiento 


EPI A A, 


hacia atrás más. prolongado o (Heth, 1976; véase también “Wagner y Larew, 1985). 


Más adelante seguiremos hablando acerca del condicionamiento de las tendencias 


inhibitorias de respuesta. 


Los procedimientos de control en el condicionamiento clásico 


Todos los procedimientos que se muestran en la figura 3.7 requieren que los 
sujetos sean expuestos a estímulos condicionados e incondicionados. El hecho de 
que se produzca aprendizaje a ritmos diferentes indica que el condicionamiento 
clásico no es resultado de la mera exposición al EC y EL El aprendizaje tiene 
lugar solamente si las presentaciones del estímulo condicionado y el estímulo 
incoodicionado se disponen de una forma especial, como ocurría en el procedi- 
miento del condicionamiento de demora corta. Los experimentos actuales de con- 
dicionamiento clásico rara vez incluyen todos los procedimientos descritos en la 
figura 3.7. Más bien, la práctica común es elegir sólo un procedimiento (normal- 
mente el de demora corta) que funcione con toda seguridad. Sin embargo, sí los 
sujetos aumentan sus respuestas en esas circunstancias, uno no puede estar seguro 
de que tal incremento sea resultado de la asociación del EC y el El. Como ya 
vimos en la discusión sobre la sensibilización en el capítulo 2, las presentaciones 
de un estímulo poderoso, como puede ser una descarga eléctrica O cualquier Otro 
El, pueden aumentar la conducta provocada por un estímulo más inocuo, un EC 
por ejemplo, sin que se haya establecido una asociación entre los dos estímulos 
(véase, por ejemplo, el fenómeno de la deshabituación discutido bajo el título 
«Características de la habituación y la sensibilización», en el capítulo 2). Por tanto, 
el aumento en las respuestas que se observa al presentar de forma repetida el 
emparejamiento EC-El, puede a veces deberse a la simple exposición al El. En las 
ocasiones en que la exposición al El produce por sí misma respuestas al EC que se 
asemejan a la RC, hablaremos de seudocondicionamiento. Los procedimientos 
de control han de ser evaluados para”asegurarse de que las respuestas que se 
desarrollan ante el EC durante el condicionamiento clásico representan una aso- 
ciación entre el EC y el El, y no efectos de sensibilización por estar EApuEntos a 


los estímulos condicionado e incondicionado. 


Los investigadores han debatido ampliamente cuáles son los caia 
de control apropiados para el condicionamiento clásico. Un procedimiento de 
control destacado consiste en presentar a los sujetos de forma repetida el estímulo 


O A O A 
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condicionado y el incondicionado, pero disponiendo el programa de forma que los 
dos estímulos se den aleatoriamente uno respecto al otro (Rescorla, 1967b). Este 
procedimiento de control aleatorio parece funcionar bien siempre y cuando haya 
muchas presentaciones del EC y del El. Sin embargo, sí sólo se realizan unos 
pocos ensayos con cada uno, pueden aparecer pruebas de condicionamiento en 
grupos de control aleatorios (Benedict y Ayres, 1972; Kremer y Kamin, 1971; 
Quinsey, 1971). En los experimentos que requieren pocos ensayos, es preferible 
usar grupos de control que reciban sólo el EC, sólo el El, o los dos, pero nunca 
emparejados. Si los recursos disponibles impiden probar los tres procedimientos 
de control, es recomendable utilizar el procedimiento que consiste en presenta- 
ciones no emparejadas del EC y el El (Para una discusión adicional de metodolo- 
gía del control, véase Gormezano y otros, 1983.) 


'LA CONTIGUIDAD Y LAS RELACIONES DE SEÑAL —!£: “pr 


ENTRE LOS ESTIMULOS CONDICIONADO E INCONDICIONADO 


¿Qué es.lo que determina la eficacia de los distintos procedimientos para el 
condicionamiento de una nueva respuesta a un estímulo incondicionado? ¿Por qué 
algunos procedimientos tienen mucho más éxito que otros para producir el condi- 
cionamiento clásico excitatorio? Estas cuestiones son fundamentales para el análi- 
sis del condicionamiento clásico y han preocupado a los investigadores durante 
décadas. La idea más simple es que el condicionamiento clásico excitatorio se debe 
a que eLnBOS el El se experimentan al mismo tiempo. A esto se le llama conti- 


asociación entre dos estímulos (el EC y el El, por o es una de las primeras 
y más recurrentes ideas en el análisis del condicionamiento clásico (véase Gorme- 
zano y Kehoe, 1981). Sin embargo, la revisión de los procedimientos de condicio- 
namiento excitatorio que se describió antes muestra que la simple noción de la 
contigiidad del estímulo no proporciona una explicación adecuada del condicio- 
namiento clásico. La presentación del EC y el El al mismo tiempo, como en el 
procedimiento de condicionamiento simultáneo, no es particularmente eficaz para 
producir condicionamiento excitatorio, El procedimiento que obtiene más éxito 
en el condicionamiento clásico excitatorio es el procedimiento de condiciona- 
miento de demora corta, en el que el EC se inicia ligeramente antes de la presen- 
tación del El. Este es sólo uno de los muchos hallazgos incongruentes con un 
principio simple de contigiiidad de los estímulos en el aprendizaje por asociación. 
A causa de esos resultados, el principio de contigiidad ha sufrido varias reformu- 
laciones y se ha ido purificando con el fin de explicar mejor los resultados de los 
experimentos de condicionamiento clásico. En el capítulo 4 vamos a discutir algu- 
nos de esos desarrollos teóricos. 

Los problemas con el principio de contigijidad simple han fomentado también 
el desarrollo de ideas alternativas sobre los mecanismos de condicionamiento clá- 
sico. Uno de los más sobresalientes se basa en la noción de que el condiciona- 
miento clásico implica el aprendizaje de una relación de señal entre el estímulo 
condicionado y el incondicionado. De acuerdo con esta idea, es más probable que 
los organismos aprendan a dar una respuesta condicionada al EC si las presenta- 


N 
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ciones del EC sirven como señal de la inmediata aparición del El. Los procedi- 
an en que el EC no se puede tomar como base para predecir el El no suelen 
acilítar una rápida adquisición de la respuesta condicionada. 


Ejemplos de relaciones de señal 


Cuando pensamos en situaciones de la vida real en que se utilizan señales 
podemos valorar fácilmente lo útil que resulta que un estímulo condicionado re- 
diga el estímulo incondicionado. Existen muchas situaciones así. Las hier or 
ejemplo, señalan normalmente la aproximación de un vehículo de a 
como una ambulancia'o un coche de bomberos. La sirena es análoga al estímulo 
condicionado, y la llegada del vehículo de emergencia es análoga al estímulo 
icondicionado. Si oyéramos la sirena siempre justo antes de la llegada de la 
ambulancia, aprenderíamos rápidamente a apartarnos de su camino. En ese caso 
la sirena sería un buen predictor, o señal, de la llegada de la ambulancia. Este 
procedimiento es análogo al procedimiento de condicionamiento de demora corta 
en el que el EC es un buen predictor del El. Por el contrario 51 no oyéramos 
nunca la sirena hasta que la ambulancia estuviera en escena no habría razón para 
reaccionar ante la sirena. La sirena no nos proporcionaría una información dell 
sobre la llegada de la ambulancia, Simplemente nos apartaríamos de su camino 
cuando llegara. Este caso es análogo al del procedimiento de condicionamiento 
simultáneo, en que la relación de señal entre el EC y el El no es muy buena 
Tendríamos menos motivos aún para apartarnos del camino cuando la sirena 
sonara, si sólo la oyéramos una vez que la ambulancia ya se hubiese ido. Este caso 
es comparable al procedimiento de condicionamiento hacia atrás. Si hay algo que 
se aprenda en estas circunstancias, es que la sirena indica que la ambulancia ha 
partido. | 

- El análisis es un poco más complicado si la relación entre el sonido de la 
sirena y la presencia de la ambulancia es comparable al procedimiento del condi- 
cionamiento de huella. En este caso la sirena pararía antes de que llegara la ambu- 
lancia. Por tanto, la presencia de la sirena indicaría que la ambulancia todavía va a 
tardar un rato en llegar. El mejor indicador de la llegada de la ambulancia sería 
pues, el cese de la sirena. Así, con el procedimiento de huella es más probable ue 
dejemos paso a la ambulancia cuando la sirena ya no suene. 7 

Si experimentáramos algo comparable al procedimiento de condicionamiento 
de demora larga, oiríamos siempre la sirena mucho tiempo antes de la llegada de 
la ambulancia. En ese caso, aprenderíamos a ignorar la sirena al principio de 
oírla, y nos preocuparíamos de dejar paso sólo después de que la sirena llevara 
sonando un rato. La experiencia de la mayoría de las personas con las sirenas 
los vehículos de emergencia es muy parecida al procedimiento de oa: 
miento de demora larga. Quizá por este motivo los conductores rara vez respon- 
den inmediatamente cuando oyen una sirena mientras van al volante. 








PRINCIPIOS DE APRENDIZAJE Y DE CONDUCTA 99 


Cualquier persona que reflexione sobre la experiencia común puede adivinar 
cuándo un estímulo (por ejemplo, el EC) sirve como señal apropiada para la 
próxima presentación de otro hecho (por ejemplo, el El). Sin embargo, esto 

ede determinarse con más precisión si se usan definiciones formales. Robert 
Rescorla (1967b) elaboró un modelo de las relaciones de señal en el condiciona- 
miento clásico que tuvo gran influencia. Su discusión fue importante, no sólo por 
su precisión, sino también porque hizo hincapié en ciertos aspectos de las relacio- 
nes de señal que no habían sido considerados previamente en el condicionamiento 


clásico. Rescorla resaltó que la calidad de un estímulo como señal de otro depende 


no sólo del modo en que los dos estímulos van emparejados, sino también de la 


cantidad de veces qué cada elemento se dá por separado, De hecho, el númeto de 
veces que el EC y el El aparecen solos puede ser más importante para determinar 
la intensidad del condicionamiento que la forma en que se emparejan cuando se 
presentan juntos. Una segunda idea importante en la que Rescorla puso énfasis es 


- que las relaciones de señal no necesitan ser siempre positivas: también pueden 


ser negativas. Es decir, un estímulo puede señalar Ta ausencia de otro estímulo de 
la misma Torma que un estímulo puede señalar Ja presencia futura de omo Hecho... 
s ideas de Rescorla sobre las relaciones de señal quedan resumidas formal- 
mente en su concepto de la contingencia entre los estímulos condicionado e 
incondicionado, La contingencia entre el EC y el El se determina a partir de la 
- comparación de dos.probabilidades, la probabilidad de que el El se dé junto al EC, 
: simbolizada como p(El/EC), y la probabilidad de que el El se dé en ausencia del 
EC, simbolizada como p(El/no EC). Si el El se presenta sólo con el EC y el EC 
nunca se presenta solo, como en el procedimiento de condicionamiento de 
demora corta, las apariciones del:El se pueden predecir perfectamente a partir de 
las apariciones del EC» Esto ilustra una contingencia positiva perfecta entre el 
EC y el El. En términos de las dos probabilidades que definen la contingencia, el 


APARTADO 3.2 Un periódico local destaca en sus titulares: Un tren arrolla el coche del 
señor P., que resultó muerto 


Una investigación del accidente reveló que las luces y las campanas de señalización del 
cruce habían funcionado correctamente. Se dijo que el señor P. estaba en buenas condicio- 
nes físicas y mentales, y que no había bebido. ¿Qué fue lo que ocurrió? ¿Por qué el señor 
P. metió el coche en las vías cuando las señales visuales y auditivas indicaban claramente 
que se acercaba el tren? Una explicación posible es que las señales no escaban ajustadas en 
una relación temporal con la llegada del tren de forma que fueran eficaces. Con frecuencia 
las campanas y las luces de aviso comienzan a funcionar antes de que el tren esté en el 
Cruce, y a menudo continúan un tiempo después de que el tren se ha marchado. Debido a 
ese ajuste ineficaz, si llegamos a un cruce cuando las señales están en marcha, no podemos 
estar seguros de si el tren está a punto de venir o sí acaba de pasar. Por tanto, los conduc- 
tores invariablemente se acercan a la vía del tren despacio cuando las señales están encen- 
didas, miran a un lado y a otro para véase si viene el tren e intentan salir rápidamente de la 
vía si es que viene. Algunos, como el señor P., no lo hacen a tiempo. Sería mucho más 
eficaz que las señales comenzaran poco antes de que el tren llegara al cruce y terminaran  -s 
en cuanto el cren hubiera pasado. Las personas estarían así seguras de que el tren llegaba 
en cuanto vieran las luces y campanas avisando, y no estarían tentados de arriesgar su vida 
metiéndose en las vías para averiguar dónde se encuentra el tren. 
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El ocurre con toda seguridad una vez que el EC ha ocurrido. Así pues, 
p(El/EC) = 1,0. Por el contrario, es absolutamente seguro que el El no se dará si 
el EC no se ha dado aún. Así pues, p(El/noEC)=0. Esas dos probabilidades 
definen una contingencia positiva perfecta. 

S1 se puede predecir la aparición del El a partir de la presencia del EC, es que 
existe una contingencia positiva entre los dos estímulos. La contingencia positiva 
perfecta descrita arriba ilustra un caso extremo. Podemos predecir el El a partir 
del EC siempre y cuando el El tenga más probabilidad de aparecer con el EC que 
sin él, Así pues, se dice que existe una contingencia positiva entre el EC y el El 
siempre y cuando p(El/EC) sea mayor que p(El/noEC). Los cazadores de ciervos, 


- por ejemplo, hacen uso de una contingencia positiva imperfecta cuando predicen 


la presencia del ciervo a partir de la visión de sus excrementos. No se ve invaria- 
blemente un ciervo cuando se encuentran excrementos de ciervo. Sin embargo 
existe una contingencia positiva entre los dos hechos porque es más probable 
localizar ciervos en áreas donde haya excrementos que en otros lugares. 

Mientras que la contingencia positiva permite la predicción de un hecho 
basándose en la aparición de otro estímulo, no es posible en cambio una predic- 
ción de tal naturaleza cuando la contingencia entre los dos estímulos es cero. Se 
dice que existe una contingencia cero entre el EC y el El si la probabilidad de que 
se dé el El con C es la misma que sin el EC. Así pues, en una contingencia 
cero, p(El/EC) = p(El/noEC). 

Puede existir una contingencia cero aún si hay ocasiones en que el estímulo 
incondicionado y el estímulo condicionado aparecen juntos. Por ejemplo, aunque 
por la mañana amanezca el cielo despejado, no se puede predecir a partir de ahí 
que va a continuar despejado todo el día. Hay días que empiezan siendo agrada- 
bles y luego se vuelven desapacibles o cielos despejados que después se nublan. 
Por tanto, las coincidencias ocasionales de días buenos tras mañanas soleadas no 
es suficiente para asociar el cielo despejado con el buen tiempo. 

También existen contingencias en las que el EC predice la «ausencia» del El. 
Tal es el caso cuando el El se presenta con más probabilidad en ausencia del EC 
que en su presencia. Estos casos suponen una contingencia negativa entre el EC 
y el El. En una contingencia negativa p(El/EC) es menor que p(El/noEC). 

Un EC que establece una relación de contingencia negativa con el El nos 
suministra tanta información sobre el El como el EC que se relaciona con el El 
mediante una contingencia positiva. La única diferencia es que el EC contingente 
negativo señala la ausencia del El. Ya hemos visto un ejemplo de contingencia 
negativa en los procedimientos de condicionamiento hacia atrás, En ellos el El se 
presenta antes del EC, de forma que el EC señala la ausencia del El durante el 
intervalo entre ensayos que viene a continuación (Moscovitch y LoLordo, 1968). 
De la experiencia común se pueden extraer también muchos ejemplos de contin- 
gencia negativa. Por ejemplo: en la facultad acabamos de hacer un examen de una 





“asignatura; esto probablemente indica que en las clases siguientes no vamos a 


tener que hacer otro examen de esa asignatura. Los médicos utilizan los síntomas 
de peso, presión sanguínea y ritmo cardiaco normales para predecir la ausencia de 
enfermedad, ya que es menos probable que estén enfermas aquellas personas que 
presentan valores normales que aquellas cuyo peso, presión sanguínea y ritmo 
cardiaco son anormales, 

Al especificar que el aprendizaje depende de la contingencia entre el EC y el 
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El, el modelo de contingencia destaca que el emparejamiento del EC y el El no es 
suficiente para que se produzca el condicionamiento clásico. No se puede predecir 
lo que los animales van a aprender, si es que aprenden algo, a partir de la exposi- 
ción a un EC emparejado con un El cierto número de veces. Por ejemplo, supon- 
gamos que a un perro se le presenta un tono cien veces, y alrededor de cincuenta 
de esas presentaciones van seguidas ¡inmediatamente por la entrega de comida. En 
base a esta información no podemos predecir lo que el perro va a aprender, 
puesto que no sabemos qué probabilidades tiene de obtener comida en la situación 
experimental cuando el tono está ausente. Si al animal nunca se le da comida en 
ausencia del tono, existirá una contingencia positiva débil entre el tono y la 
comida. En esas condiciones el perro aprenderá a salivar ante el tono. Sin 
embargo, si al perro se le alimenta con la misma frecuencia en ausencia del tono 
que inmediatamente después del tono, la contingencia entre el EC y el El será 
cero. En este caso puede que el perro aprenda a no hacer nada como respuesta al 
tono. Por último, si al perro se le alimenta con más frecuencia en ausencia del 
tono que inmediatamente después de él, existirá una contingencia negativa entre 
el EC y el El, y el perro puede aprender a considerar el tono como una señal débil 
para la ausencia de comida. 


EL CONDICIONAMIENTO PAVLOVIANO INHIBITORIO 


Como ya advertimos antes, los estímulos se pueden condicionar para señalar 
la ausencia de un estímulo, incondicionado venidero; det mismo modo que señalan 
la próxima aparición de un estímulo incondicionado. Aprender que un estímulo 
señala la ausencia de.un El se denomina condicionamiento inhibitorio. Aunque 
el condicionamiento inhibitorio fue descubierto por Pavlov al mismo tiempo que 
el condicionamiento excitatorio, los psicólogos americanos no le prestaron mucha 
atención hasta mediados de los años sesenta (Boakes y Halliday, 1972; Rescorla, 
1969b). Resulta sorprendente que durante tanto tiempo se haya prestado tan poca 
atención a los procesos de condicionamiento inhíbitorio, La inhibición condicio- 


; nada enseña a los animales a in inhibir y retener una respuesta, condicionada. La 


A A 


inhibición de la respuesta condicionada es tan importante en la organización de la 
conducta como la capacidad de dar respuestas condicionadas. Además, las señales 
que indican qué estímulos no van a presentarse suministran tanta información 
acerca del mundo como las señales que le dicen al organismo las que sí van a 
hacerlo. Ya hemos señalado brevemente que el condicionamiento inhibitorio 
implica el aprendizaje de una relación de señal negativa entre el EC y el El. 
Vamos a discutir ahora algunos de los procedimientos importantes para conseguir 
una inhibición condicionada. Discutiremos también la forma en que reaccionan 
los animales ante estímulos inhrbitorios condicionados. (Véase una revisión de las 
investigaciones recientes sobre imhibición condicionada en Miller y Spear, 1985.) 


Procedimientos para el condicionamiento inbibitorio 


o — 
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experimental. En nuestra vida diaria existen muchas señales que indican la ausen- . 
cia de hechos. Los carteles de «cerrado», «no. funciona» » <Rrohibida la entrada», 
son todos de. ese tipo. Sin embargo, ésas señales suministran una información * 
significativa e influyen en nuestros actos solamente si indican la ausencia de algo 
que esperábamos ver. Por ejemplo, si nos encontramos con el cartel de «no hay 
gasolina» en una gasolinera, nos frustramos y desanimamos, y, por tanto, no 
entramos. El cartel de «no hay gasolina» suministra una información importante 
porque normalmente esperamos que las estaciones de servicto dispongan de gaso- 
lina. Sin embargo, ese mismo cartel carece de interés para nosotros si se coloca a 
la puerta de una joyería, y en tal caso, lo más probable es que no nos disuada de 
entrar en la tienda a mirar joyas. Este ejemplo ilustra la regla general de que el 
-— condicionamiento imhibitorio y el control inhibitorio de la conducta ge. dan sólo si _ 
“existe un contexto excitarorio para, el estímulo jocondicionado.en, cuestión (por 
ejemplo, Baker y Baker, 1985; Fowler, Kleiman y Lysle, 1985; LoLordo y Fairless, 
1985). Este principio hace al condicionamiento inhibitorio muy diferente del con- 
dicionamiento excitatorio, que no depende tanto de la existencia de un contexto 


especial. 


1d 
E 


El procedimiento estándar para la inbibición condicionada. Pavlov reconoció 
la importancia de un contexto excitatorio para el condicionamiento de las tenden- 
cias inhibirorias de la respuesta y se preocupó de proporcionar ese contexto ela- 
borando un procedimiento estándar para condicionar la inhibición (Pavlov, 1927). 
La técnica, esquematizada en la figura 3.8, incluye dos estímulos condicionados y 
dos modalidades de ensayo de condicionamiento, repetidas en un orden aleatorio. 
El estímulo incondicionado sólo se presenta en algunos ensayos. Cuando aparece 
el El, uno de los estímulos condicionados lo anuncia, es el EC + (un tono, por 
ejemplo). En el otro tipo de ensayo, el EC + se presenta junto con el segundo 
estímulo condicionado, el EC— (una luz, por ejemplo). El El no se presenta en 
esos ensayos. Como el animal recibe ensayos repetidos de EC + seguidos de El y 
EC+/EC — seguido de ningún El, el EC se convierte gradualmente en una señal 
que indica la ausencia de El (por ejemplo, Marchant, Mis y Moore, 1972). Los 
ensayos en que el EC— y el EC+ se presentan sn el El son ensayos de condicio- 
namiento inhibitorio. El contexto excitatorio para este condicionamiento lo pro- 
porciona la presencia del EC + en los ensayos de condicionamiento inhibitorio. Al 
ir emparejado el EC + con el El en varios ensayos, el EC+ se condiciona a provo- 
car una expectativa de El, La ausencia del El en los ensayos de condicionamiento 
inhibitorio se produce, por tanto, en un contexto en el que el sujero espera el El. 








ca 


Figura 3.8. —Procedimiento estándar para la inhibición condicionada. En algunos ensayos el EC+ se 
empareja con el El, En otros ensayos el EC-+ se empareja con el EC— y no se presenta el El. El 
procedimiento es eficaz para dotar al EC— de propiedades inhibitorias condicionadas. 
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Esta expectativa convierte la ausencia del El en un acontecimiento importante y 
da como resultado el condicionamiento inhibitorio del EC—. | 

El procedimiento de inhibición condicionada estándar es análogo a aquellas 
situaciones en que se introduce un elemento que impide un desenlace que de otro 
modo sería altamente probable. Un semáforo en rojo en.un cruce. con mucho 
tráfico es una señal (EC+) de peligro” potencial (el EL. Sia n embargo, si un policía 
de tráfico nos. indica-que debemos. cruzas la. calle a. pesar de la luz roja (quizá 
pórque los semáforos están estropeados), lo más probable es que no tengamos un 
accidente. Es-probable que la luz roja (EC +) unida a los gestos del agente (EC —,) 


nó vaya seguida de peligro. Los gestos actúan como un EC — para inhibir rs 


bloquear nuestra vacilación en cruzar la. calle. : 'a causa de la luz roja. 


+ La inbibición diferencial. Se lama inhibición diferencial a otro procedi- 
ica que se utiliza con frecuencia para lograr a imhibición condicionada. Este 
"Procedimiento és muy parecido al: procedimiento estándar descrito arriba. Como 
ocurría en el procedimiento” estándar, el El se presenta en “algunos ensayos, y su 
aparición viene siempre anunciada por la prsentación del EC+, En otros ensa- 
yos, el El no se presenta, y los animales experimentan sólo el EC —. Así pues, el 
procedimiento de inhibición diferencial implica dos modalidades de ensayo: El 
seguido de EC + y EC— seguido de ausencia de El (véase figura 3.9). Como en el 
procedimiento estándar, el EC — se convierte en estimulo inhibitorio condicio- 
nado (por ejemplo, Rescorla y LoLordo, 1965). 

El | procedimiento de inhibición diferencial es análogo a dos semáforos en un 
cruce, uno rojo y otro verde. La luz roja (EC -+) señala el peligro (ED de pasar por 
el cruce, mientras que la”Juz verde (EC —y señala la ausencia de peligro (no ED. 
Si se > atraviesa y el cruce mientras está-encendida la luz verde (EC—), uno _puede' 
confíar en que no va a.tener un. accidente. o 

“No está tan claro qué es lo que proporciona el contexto excitatorio para que se 
condicione la inhibición en el procedimiento de condicionamiento diferencial 
como lo está en el procedimiento estándar. En el procedimiento estándar la pre- 
sencia del EC + en los ensayos iniciales del condicionamiento inbibitorio provoca 
alguna expectativa de que aparezca el El. El EC-+ no está presente en los ensayos 
de condicionamiento imhibitorio del procedimiento de condicionamiento diferen- 
cial. De hecho, esta es la única diferencia importante entre los dos procesos. Sin 
embargo, exíste otro factor en el procedimiento de condicionamiento diferencial 
que puede producir un contexto excitatorio durante los ensayos de condiciona- 
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Figura 3.9.—Procedimiento de la inhibición diferencial. En algunos ensayos el EC+ es emparejado 
con el El. En otros ensayos el EC — se presenta aistado, El procedimiento es eficaz para dotar al EC — 
de propiedades inhibitorias condicionadas. 


Ne 


Y 


EA 


Er A 


mA te 


en” 


$ 


104 MICHAEL DOMJAN Y BARBARA BURKHARD 


miento imhibitorio (EC—, no El). Como el El se presenta periódicamente, los 
estímulos propios de la siruación experimental pueden ser condicionados por el 
El, de forma que el animal tenga alguna expectativa de que se presente el El 
cuando se encuentra en esta situación. Así pues, las claves contextuales de la 


situación experimental pueden suministrar el contexto excitatorio para el apren-. 


dizaje de la inhibición en el procedimiento de inhibición diferencial. Sin embargo, 
esto no ocurre siempre, y, por tanto, el procedimiento de inhibición diferencial no 
es siempre tan eficaz para producir la innhibición condicionada como lo es el 
procedimiento estándar (véase LoLordo y Fairless, 1985, para una discusión más 
extensa del tema). 


“*” La contingencia negativa del EC-El. Los dos procedimientos para producir la 


inhibición condicionada, el procedimiento estándar. y el diferencial, implican.una... 


contingencia negativa entre. el estímulo condicionado inhibitorio (EC—2.1. el 


estímulo incondicionado, En ambos procedimientos lá probabilidad de encontrar... 


AA ñ 
ha pre 


el El junto.con.el EC —, o poco después de él, es:cero. Cúando. el.EC— no se 


A 
mm. tes A 


€e" Presenta, la probabilidad de obtener él El'es mayor que cero. Así pues; p(El/noECT”" 


eee, 


es mayor que p(El/EC-—). En los dos procedimientos interviene también el con- 
dicionamiento excitatorio de un EC+ explícito. Este segundo aspecto de los pro- 
cedimientos no es absolutamente necesario para que se dé la inhibición condicio- 
nada. Los sujetos no tienen que estar expuestos á un EC+ emparejado con un El 
para adquirir tendencias inhibitorias ante el EC—. El único requisito esencial es 
que haya una contingencia negativa entre el EC imhibitorio y las presentaciones 
de los El. Por tanto, la inhibición condicionada puede también provenir de proce- 
dimientos en los que sólo existe un estímulo condicionado explícito, siempre que 


- este EC establezca con el El una relación de señal negativa. Es decir, la probabili- 


dad de que el El aparezca en ausencia del EC es mayor que en su presencia, o 
inmediatamente después de que se haya dado el EC. Un ejemplo de procedi- 
miento que reúne ese requisito viene esquematizado en la figura 3.10. Periódica- 
mente se presenta el El aislado. Sin embargo, cada presentación del EC va seguida 
de una ausencia predecible del El. | 
La inhibición condicionada. se observa de. una. manera. fiable.en..los procedi— 
mientos en los que el único estímulo condicionado explícito establece una relación 


SE liga + [8 


de contingencia negativa con el El (Rescorla, 19692). ¿Qué es lo que proporciona 
el contexto excitatorio para esta inhibición? Puesto que no existe ningún EC+ 
explícito que prediga las apariciones del El en este procedimiento, el El se pre- 
senta en la situación experimental sin venir señalado. Las claves ambientales de la 





Figura 3.10.—Procedimiento de contingencia EC-El negativa para dotar al EC de propiedades inhibi- 
torias condicionadas, 
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cámara experimental quedan, por tanto, condicionadas a predecir las apariciones 
de los El. Así pues, como en la inhibición diferencial, el contexto excitatorio para 
el condicionamiento inhibitorio lo proporcionan las claves contextuales de la 
situación experimental (Dweck y Wagner, 1970). 


La medida de la imbibición condicionada 


Una vez que un animal aprende que un estímulo señala la ausencia posterior 
de un estímulo incondicionado, ¿qué hace con esa información? ¿Cómo se mani- 
fiesta el proceso inhibitorio condicionado en la conducta? Para la excitación con- 
dicionada, la respuesta a la misma pregunta es sencilla. Los estímulos que se han 
condicionado para predecir la aparición del El, normalmente provocan conductas 
que no eran evidentes en presencia de esos estímulos antes del condicionamiento. 
Así pues, los estímulos condicionados excitatorios llegan a provocar respuestas 
nuevas, como salivación, apego o parpadeo, dependiendo de cuál sea el estímulo 
incondicionado. Se podría esperar que los estímulos imhibitorios condicionados 
provocaran reacciones opuestas a éstas: a saber, supresión de salivación, de apego 
o de parpadeo. ¿Cómo nos las arreglamos para medir los opuestos de las 
respuestas? 


APARTADO 3,3 La iabibición condicionada y la protección de las úlceras 


La exposición a situaciones desagradables y aversivas puede dar lugar a diversos sínto- 
mas fisiológicos de estrés, entre los que se incluyen las úlceras de estómago. Un factor 
importante que determina la gravedad de los síntomas del estrés es hasta qué punto las 
apariciones de los estímulos aversivos son señalizadas, y por tanto se hacen predecibles 
para el individuo, En muchos casos los síntomas de escrés son bastante menos graves 
cuando los estimulos se han señalizado que cuando son imprevisibles (Weiss, 1970). Por 
ejemplo, las ratas expuestas a descargas señalizadas desarrollan menos úlceras y más leves 
que las ratas expuestas a descargas no señalizadas (Seligman, 1968; Weiss, 1971). Además 
de reducir la patología gástrica, la descarga previsible produce menos miedo y ansiedad 
crónicos que las descargas no señalizadas (Hymowitz, 1979; Seligman, 1968; Seligman y 
Meyer, 1970). y 

Una explicación interesante, llamada «hipótesis de la señal de seguridad», atribuye esos 
hallazgos a la inhibición condicionada (Seligman, 1968; Seligman y Binik, 1977). La pre- 
sencia de una señal para la descarga obviamente permite al animal predecir cuándo va a 
ocurrir el hecho aversivo. La hipótesis de la señal de seguridad sostiene que las señales de 
seguridad también le permiten al sujeto predecir cuándo no va a ocurrir la descarga, por- 
que las descargas nunca se producen cuando la señal está ausente. Por tanto, la ausencia de 
una señal para la descarga sirve como estimulo inhibitorio condicionado e indica periodos 
de seguridad en relación con la descarga. Según la hipótesis de la señal de seguridad, los 
animales expuestos a descargas señalizadas desarrollan menos úlceras y menos ansiedad 
porque experimentan esos periodos de seguridad. Los animales a los que no se les señaliza 
la descarga no pueden nunca estar seguros de cuándo se les va a presentar la descarga y 
cuándo no, y por tanro nunca experimentan períodos de seguridad. 

Los hallazgos de la investigación sugieren que la enfermedad psicosomática causada 
por la exposición a situaciones aversivas se pueden reducir sustancialmente presentando 
estímulos inhibitorios condicionados que señalen periodos de seguridad y permitan a los 
sujetos relajarse. La implicación es que un ejecutivo molesto por las úlceras no tiene nece- 
sariamente que abandonar su trabajo. Los síntomas de estrés pueden reducirse si la per- 
sona aprende a relajarse periódicamente cuando tiene un día ajetreado. 
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: eios es un buen ejemplo. Sin un estímulo 
106 MICHAEL DOMJAN Y BARBARA BURKHARD direcciones. El parpadeo en los conejos es , e 4 biera condicionado 
elicitante, los conejos rara vez parpadean. Si un estímu o se hu e 
a ] Le . : asa . inhibi esta de parpadeo, no observaríamos ningún parpadeo 
<tr> Los sistemas de respuestas bidireccionales. La identificación de tendencias de ep al 


presentara este estimulo. El problema es que el animal tampoco oia 
cuando estuviera el estímulo ausente. Por tanto, no podríamos estar seguros : e 
que la falra de respuesta reflejara una supresión activa del parpadeo, o, simp a 
mente, que la línea de base de esta conducta sea baja cuando no o NEO a 
estimulación. Se tienen que utilizar técnicas más sofisticadas antes de e e 
mos llegar a la conclusión de que un estímulo imbibe activamente el parpa Co 
procedimiento más versátil para valorar, la inhibición es la prueba del estím de 
compúesto o prueba de la sumación. Este procedimiento a una a 
divulgación gracias a Pavlov (por ejemplo, Pavlov, 1927) y en las E a 
contemporáneas está empezando a ser considerado como A a PA 
aceptable para medir la inhibición condicionada (véase Mil e a es E a 
Las dificultades que crean las respuestas con un bajo nivel de línea de pe 
superan con la prueba del estímulo compuesto, ya que se presenta un a 
excitatorio condicionado que provoca la respuesta condicionada. La in ibición 
condicionada se mide entonces en térmiños de reducción o inhibición E pe 
respuestas condicionadas. Asf'pues, la prueba consiste en observar los e e e 
un EC inhibitorió «en composición» con un EC + excitatorio, Otra forma de Sd 
siderar el procedimiento es ae la E de los efectos de un estimulo 
inhibitorio (EC—>) y un estímulo excitatorio % 
o y Black (1969) ilustra la utilidad de a prueba e 
estímulo compuesto para evaluar la inhibición en los E de supres se 
condicionada. Los sujetos del grupo de inhibición condicionada reci E pel co 
dicionamiento diferencial en el que se presentaba periódicamente un Í que 
terminaba con una descarga eléctrica breve y, periódicamente, se presentaba un 


respuesta Opuestas es muy fácil con los sistemas de respuesta que pueden cambiar 
en direcciones Opuestas a partir de una actuación de línea de base (una actuación 
normal). Esto es habitual en muchas respuestas fisiológicas. El ritmo cardiaco, la 
respiración y la temperatura, Por ejemplo, pueden aumentar o disminuir a partir 
de un nivel normal. Ciertas respuestas comportamentales son también bidireccio- 
nales. Por ejemplo, los animales pueden acercarse a un estímulo o alejarse de él, y 
la cantidad de veces que presionan la palanca puede aumentar ó disminuir. En 
esos casos, la excitación condicionada produce un cambio en la conducta en una 
dirección, y la inhibición condicionada produce un cambio de conducta en la direc- 
ción opuesta. El Prócedimiento de seguimiento ¡del signo es el usado a 


frecuencia para demostrar el condicionamiento inhibitorio de respuestas bidirec- 
cionales. Como ya se puso de manifiesto anteriormente, las palomas se acercan a 
estímulos visuales que señalan la inminente presentación de comida. Si se utiliza 
por el contrario un procedimiento de condicionamiento imhibitorio, de forma que 
el estímulo visual se convierte en una señal de ausencia de comida, las palomas se 
alejan del EC (Hearst y Franklin, 1977; Wasserman, Franklin y Hearst, 1974). 
También se han obtenido pruebas de condicionamiento inhibitorio de. respuestas 
bidireccionales usando la técnica de supresión condicionada en las ratas. Como ya 
se vio, los estímulos que han sido condicionados para señalar una descarga eléc- 
trica posterior suprimen en las ratas las respuestas de presión de la palanca con la 
que obtienen comida. Por el contrario, los estímulos que han sido condicionados a 
señalar la posterior ausencia de descarga aumentan la tasa de respuestas de pre- 
sión de la palanca para conseguir comida (Hammond, 1966; véase también 
Wesierska y Zielinski, 1980). La preferencia de sabor es otro buen ejemplo de 
bidireccionalidad. Ya hicimos la observación de que los animales reducen su pre- 
ferencia por los sabores que se han emparejado con una enfermedad, Aumenta su 
preferencia, sin embargo, por aquellos sabores que han sido condicionados a pre- 
decir la ausencia de enfermedad (Batson y Best, 1981; Best, 1975). 

Conviene advertir que la simple observación de una respuesta opuesta a la 
reacción obtenida con un estímulo excitatorio condicionado no es a veces sufi- 
ciente para llegar a la conclusión de que se ha producido condicionamiento inhibi- 
torio. Se debe uno asegurar de que la topografía, o forma, de la respuesta opuesta 
se debió a la contingencia negativa entre el EC y el El. La mera exposición al EC, 
a veces produce una reacción al EC opuesta a la que se observa normalmente con 
estímulos excitatorios condicionados. Esto es así, por ejemplo, en el caso de las 
preferencias de sabor. La simple exposición a un sabor, a menudo, aumenta la 
preferencia por ese sabor (Domjan, 1976). El condicionamiento 1mhibitorio 
mediante intoxicación también aumenta la preferencia por un sabor (Best, 1975). 
Por tanto, el condicionamiento inhibitorio tiene que producir mayor preferencia 
por los sabores que la que se observa con la simple exposición al sabor, antes de 
que nos podamos asegurar de que la inhibición condicionada es la responsable del . 
resultado. o 


na 


Figura 3.11.—Prueba de inbibi- 
ción de un estímulo compuesto 

utilizada en un experimento de 
pe condicionada supresión condicionada. En el 
grupo de inhibición condiciona- 
da, el EC— servía para predecir 
Grupo de la ausencia de descarga. En el 
comparación grupo de comparación, el EC— 
era un nuevo estímulo. En el 
grupo de inhibición condiciona- 
da el EC — producía una reduc- 
ción del grado de supresión de la 
respuesta alcanzado gracias al 
EC+ condicionado a descarga, 
pero no tenía efecto en el grupo 
de comparación. 


Razón de supresión 





Sólo 
EC+ EC+ 


> ta. += La prueba del estímulo compuesto o prueba de la sumación. El condiciona- 
miento inhibitorio se puede investigar directamente.en-los.sistemas de respuesta 
bidireccionales. Sin embargo, muchas respuestas no pueden cambiar en las dos 
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EC— sin descarga. (Se usaron estímulos visuales y auditivos como EC + y EC —-..) 
Durante esta parte del experimento, el grupo de comparación recibió sólo el EC + 
emparejado con la descarga, de forma que para ellos no se convertía el EC— en 
una señal de ausencia de la descarga. A continuación, los dos grupos recibieron 
dos modalidades de ensayos de prueba. Durante uno de los ensayos de prueba, se 
presentaba solamente el EC+ para determinar hasta qué punto aprendían los 
animales la supresión de la respuesta a ese estímulo. Durante el otro ensayo de 
prueba, se presentaban simultáneamente el EC+ y el EC—. En la figura 3,11 
vienen resumidos los resultados. En el grupo de inbibición condicionada se dio 
una supresión de la respuesta menor cuando el EC+ y el EC— se presentaron 
simultáneamente, que cuando el EC+ se presentó solo, Este resultado fue debido 
a que el EC— se había convertido en una señal de la ausencia de descarga eléc- 
trica. Es decir, el EC— imhibía la supresión de la respuesta producida por el 
EC. Ese efecto de inhibición no se daba en el grupo de comparación. En qe 
sujetos, el EC— no se había condicionado a señalar la ausencia de descarga. D 
hecho, el EC— se presentó por primera vez durante los ensayos de prueba. La 
presencia del EC— no inhibió la supresión de la respuesta producida por el EC+ 
en el grupo de comparación. 


me 


temente para medir la inhibición condicionada es. la prueba del retraso en la... 


> La prueba del retraso en la adquisición. Otra prueba indirecta usada frecuen. . 


-. 


adquisición A LPor. ejemplo, Hammond, 1968; Rescorla, 1969a). BL Fundameñiode- 


ésta. prue prueba" es también bastañte senallo: si un estímulo inhibe activamente una. 
respuesta concreta, sería extremadamente difícil condicionar. ese estimulo paraa 
Que provocara esa mismá «conducta. En otras palabras, el ritmo de adquisición de 
una respuesta condicionada concreta debería retrasarse si el estímulo provoca ini- 


-sialmente. una inhibición. de .la.. respuesta... 


AA 


Aunque en las investigaciones sobre inhibición condicionada se ha empleado 
con frecuencia la prueba del retraso en la adquisición, los estudios recientes sugie- 
ren que esta prueba no es tan útil, para valorar la inhibición condicionada, como la 
prueba del estímulo compuesto. Una dificultad seria es que son muchos los facto- 
res que pueden retrasar el curso del condicionamiento clásico excitatorio. En el 
capítulo 4 vamos a discutir algunos de esos factores. La existencia de causas muy 
diversas de retraso en la adquisición dificulta la identificación de un caso concreto 
de adquisición retardada que sea debido a la inhibición condicionada (véase, por 
ejemplo, Baker y Baker, 1985). Otra dificultad es que la prueba del retraso en la 
adquisición no permite detectar ciertas formas de inhibición condicionada (por 
ejemplo, Holland, 1985). 


ES Ms ! . 


LÁ EXTINCION 00 4 








Hasta ahora, nuestra discusión sobre condicionamiento clásico se ha centrado 
en diversos aspectos de la adquisición de nuevas respuestas a los estímulos, ya 
sean excitatorios o inhibitorios, Sin embargo, sería maladaptativo que, una vez 
condicionados los estímulos, la respuesta que da el animal a esos estímulos per- 
maneciera fija el resto de su vida. Del mismo modo que les conviene a los anima- 
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les aprender nuevas respuestas a los estímulos, es adaptativo para ellos que des- 

-aparezca esa conducta una vez que las circunstancias ya no precisan de ella. El 
proceso por el que las respuestas condicionadas a los estímulos van decreciendo se 
llamá extinción. El proceso para extinguir un estímulo condicionado es presentar 
repetidamente el EC sin el estímulo incondicionado, o sin que exista ningún tipo 
de relación de señal con el El. Si el animal ha sido condicionado para salivar como 
respuesta a una campana, por ejemplo, y la campana se presenta de forma repe- 
tida sin la comida, la salivación ante la campana irá decreciendo. 

Una advertencia sobre terminología: los procedimientos de extinción se dice 
que extinguen las respuestas y/o los estímulos condicionados, .no los organismos. 
Los animales no mueren cuando están expuestos a condicionamientos de extin- 
ción. Otro comentario importante sobre la definición es que la pérdida de la 
respuesta condicionada que se produce por la extinción no es la misma que puede 
ocurrir a causa del. olvido. En la extinción, las presentaciones repetidas del EC 
son responsables por sí solas del descenso gradual de la respuesta condicionada. 
Olvidar, por el contrario, consiste en un declíve en la intensidad de la respuesta 
condicionada que puede ocurrir simplemente por el paso del tiempo. La extinción 
implica una experiencia especial con el estímulo condicionado. El olvido ocurre 
cuando de forma prolongada na, se da una exposición al estímulo condicionado. 


La extinción y la habriuación 


El procedimiento para la extinción de los estímulos condicionados es muy 
similar a los procedimientos que discutimos en el capítulo2 para producir habi- 
tuación. Tanto la extinción como la habituación implican la presentación repetida 
de un estímulo. La diferencia esencial entre ellas es que, en da extinción, el estí- 
mulo que intervenía había sido condicionado de antemano. En cambio, no se 
requiere una fase previa de condicionamiento para la habituación. Teniendo en 
cuenta que los procedimientos de la extinción y de la habituación son similares, se 
podría esperar que existieran semejanzas en los resultados que se obtienen. Los 
investigadores comienzan a descubrir estas semejanzas. Los estudios recientes han 
mostrado, por ejemplo, que los efectos del intervalo entre las sucesivas presenta- 
ciones de un estímulo son similares en los modelos de habituación y de extinción 
(Westbrook, Smith y Charnock, en prensa). 

Otra característica importante de la habituación es que, con el paso del 
tiempo, el estímulo recobra su capacidad de evocar la respuesta. Este fenómeno se 
llama «recuperación espontánea» de la habituación. Un efecto parecido se observa 
con los estímulos y/o las respuestas que se extinguen. Si, después de una serie de 
ensayos de extinción, se le da al animal un periodo de descanso fuera del 
ambiente experimental, puede producirse la recuperación espontánea de la res- 
puesta extinguida (Pavlov, 1927). Sería de esperar una menor recuperación 
espontánea después de sucesivas series de ensayos de extinción, como ocurriría en 
la habituación. Fimalmente, no habría recuperación después de los períodos de 
descanso. 

Los efectos que ejercen los estímulos novedosos sobre la pérdida de disponibi- 
lidad a responder son similares "en la habituación y en la extinción. Como ya 
advertimos en el capítulo 2, la presentación de un estímulo extraño a menudo 
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produce una recuperación de la respuesta elicirada por el estímulo habituado 
(deshabituación). Se da un efecto comparable en la extinción. Si después de una 
serie de ensayos de extinción se presenta un estímulo novedoso, puede producirse 
una recuperación de la respuesta al EC extinguido (Pavlov, 1927). Esta recupera- 
ción de la respuesta condicionada producida por la novedad se llamaydesinhibi- 
ción. Es importante “distinguir entre desinhibición y recuperación espontánea. 
- Aunque los dos procesos sean formas de recuperación de la respuesta condicio- 
nada, en la recuperación espontánea la recuperación ocurre simplemente por el 


- e . q or 7 . , 
- paso del tiempo, y en la(desinhibición ocurre por la presentación de un estímulo 


A 


. novédoso. 


. Qué se aprende en la extinción 


El fenómeno de la extinción se ajusta a nuestra definición de aprendizaje en 
tanto que implica un cambio en la conducta (la pérdida de la disponibilidad a 
responder al estímulo) comio resultado de la experiencia (presentaciones repetidas 
del EC). Sin embargo, uno se puede preguntar qué es lo que realmente se 
aprende. Una respuesta obvia es que la extinción no supone el aprendizaje de 


“algo nuevo, sino, simplemente, el desaprendizaje de la tendencia de respuesta 


previamente condicionada. Según este punto de vista, el descenso gradual de la 
. respuesta condicionada debido a la extinción refleja simplemente la pérdida de 


aquello que se había aprendido antes. En vez de adoptar ese punto de usa Par | 


lov (1927) sugirió que, durante la extinción, los animales aprenden a inhibi 
forma activa la materialización de la respuesta condicionada en presencia del EC. 
De acuerdo con esta interpretación, la extinción de una respuesta condicionada no 
supone la pérdida del aprendizaje original, sino, más bien, el aprendizaje de una 
tendencia a responder antagónica o inhibitoria. Esta inhibición condicionada 
impide entonces la aparición de la respuesta condicionada. 

La prueba primordial para la interpretación de la extinción como inhibición 
condicionada fue suministrada por el fenómeno de la desinhibición. Pavlov hizo 
el siguiente razonamiento: si la extinción consiste en aprender a inhibir la res- 
puesta condicionada al EC, entonces la respuesta debería recuperarse si esta imbi- 
bición fuera interrumpida mediante algún tratamiento. La presentación de un 
estímulo novedoso presumiblemente alteraría la inhibición, provocando así una 
recuperación en la respuesta condicionada, fenómeno que conocemos como 
desinhibición. 

El fenómeno de la desinhibición proporciona algún fundamento a la idea de 
que la;extinción supone un condicionamiento de la inhibición al EC. Sin embargo, 
no parece que la extinción implique el mismo tipo de inhibición que aprenden los 
animales a partir de la contingencia negativa entre EC y El (Rescorla, 1969b). 
Como ya observamos antes, hay tres formas de obtener pruebas de que existe una 
inhibición condicionada resultante de la contingencia negativa EC - El Una posi- 
bilidad, exclusiva de los sistemas de respuestas bidireccionales, es que la respuesta 
elicitada por el EC inhibitorio sea opuesta a las suscitadas por el estímulo condi- 
cionado excitatorio en los sistemas de respuesta bidireccionales. Un retraso en el 
condicionamiento excitatorio provocado por el EC inhíbitorio, y la disminución 
en las respuestas condicionadas provocada por los estímulos condicionados excita- 
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torios en las pruebas compuestas, son las otras dos pruebas consistentes. Ate- 
niéndonos a esas tres clases de prueba, un EC extinguido no es un EC inhibitorio. 
En los sistemas de respuesta bidireccionales no se ha observado que los estímulos 
condicionados extinguidos, provocaran respuestas opuestas a las provocadas por 
los estímulos condicionados excitatorios. De hecho, es probable que después de la 
extinción, el EC no provoque ningún cambio en las condiciones de línea de base 
de la conducta. Un estímulo condicionado extinguido no es tampoco más difícil de 
condicionar que un estímulo nuevo. En realidad, se observa, por lo general, el 
resultado contrario: el condicionamiento tiene lugar más rápidamente con estímu- 
, los condicionados, previamente extinguidos, que con estímulos nuevos (Konorski 
y Szwejkowska, 1950, 1952). Por último, en una prueba compuesta, un estímulo 
extinguido no inhibe las respuestas condicionadas provocadas por un estímulo 
condicionado eficaz. Más bien, no es infrecuente observar que se facilitan las res- 
puestas cuando el EC extinguido se presenta junto con un EC eficaz (Reberg 
1972), IS 
Las pruebas resumidas arriba indican que la extinción no produce el mismo 
tipo de inhibición de la conducta que el que se aprende en los procedimientos de 
inhibición conditionada. Evidentemente, los procedimientos de extinción produ- 
cen la supresión de la conducta a través de alguna otra clase de mecanismo para 
inhibir la respuesta. La naturaleza precisa de ese mecanismo no ha podido ser 
comprendida todavía (véase la propuesta de Bouton y Bolles, 1985). Sin embargo 
es evidente que la extinción no implica el desaprendizaje de una respuesta condi- 
cionada y el retorno del sujeto a su estado primitivo, 


APLICACIONES DEL CONDICIONAMIENTO CLASICO 


El condicionamiento clásico se estudia normalmente en situaciones de labora- 
torio artificiales. Sin embargo, no hace falta saber mucho sobre condicionamiento 
clásico para comprender que éste ocurre con frecuencia fuera del laboratorio y 
que se puede aplicar a una gran variedad de situaciones. El condicionamiento 
clásico tiene mayor probabilidad de desarrollarse cuando un hecho precede a Otro 
en un emparejamiento EC-El de intervalo corto O en situaciones con una contin- 


gencia fuerte. Esas contingencias se encuentran en muchos aspectos de la vida. 


Como ya mencionamos al principio del capítulo, los estímulos ambientales tienen 
lugar en.una secuencia temporal ordenada.. Una de las razones es el principio 
físico de la causalidad: ciertos hechos no pueden ocurrir si antes no se han produ- 
cido otros hechos. 

Para concluir el presente capítulo, vamos a describir una serie de ejemplos y 
de aplicaciones del condicionamiento clásico. En atención a la experiencia de Pay- 
lov como fisiólogo, vamos a comenzar con varios ejemplos sobre el papel que 
juega el condicionamiento clásico en el control de los procesos fisiológicos. Des- 


pués vamos a describir algunos ejemplos interesantes de condicionamiento clásico 
en la conducta humana. 
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El aparato digestivo nos proporciona un ejemplo claro de secuencia temporal 
entre hechos que precisan de un orden de causas y efectos. La comida no entra en 
la boca hasta que el sujeto la ve, se aproxima a ella, la huele y se la pone en la 
boca. La comida no se traga hasta que no se mastica, no aparece en el estómago 
hasta que no se traga. De forma similar, no entra en el intestino delgado hasta 
después de pasar por el estómago, y no entra en el intestino grueso hasta que no 
pasa por el intestino delgado. Esta secuencia de hechos convierte el aparato diges- 
tivo en un candidato de primer orden para la intervención del condicionamiento 
clásico. 

Aunque mo todos los procesos de condicionamiento que intervienen en la 
digestión han sido verificados experimentalmente, no resulta difícil especular 
acerca del papel del condicionamiento clásico en la digestión. Sabemos que los 
diferentes tipos de comida requieren la secreción de combinaciones diferentes de 
jugos gástricos dentro del canal alimentario. Se necesitan ciertas combinaciones y 
ciertas cantidades de secreciones estomacales e intestinales para digerir un filete 
grande y sabroso, y se necesitan otras combinaciones y otras cantidades para dige- 
rir unos huevos revueltos. Como la comida pasa siempre a través del canal ali- 
mentario siguiendo la misma secuencia (boca, estómago, intestino delgado, intes- 
tino grueso), se puede especular que los estímulos que. intervienen en un estadio 
del proceso se.convierten en señales que indican el lugas hacia el que se dirige la 
comida y qué va a ocurrir en el próximo estadio. De esta manera, los jugos diges- 
tivos pertinentes se pueden segregar en cada parte del. tracto alimenticio antes de 
que la comida llegue allí. Así pues, el estómago puede empezar a segregar las 
sustancias digestivas pertinentes cuando la comida se encuentra en la boca, o 
incluso antes, cuando el sujeto huele la comida. De forma similar, el intestino 
delgado se puede preparar para la llegada de la comida de acuerdo con los estímu- 
los que proporciona la comida en la boca y en el estómago. Si se produjeran esas 
secreciones anticipatorias (y no hay razón para pensar lo contrario), el proceso. 
digestivo se aceleraría. : | 

Un ejemplo de respuesta condicionada digestiva que ya ha sido investigado es 
la secreción de insulina como respuesta a los sabores dulces. La insulina inter- 
viene en la digestión de los azúcares. Es liberada por el páncreas como respuesta 
incondicionada a la presencia de azúcar en el tracto digestivo. La presencia de 
azúcar en el estómago y en el intestino delgado va precedida siempre por el sabor 
de azúcar en la boca. Por tanto, el sabor del azúcar puede condicionarse a estimu- 
lar la liberación de insulina como respuesta condicionada anticipatoria. Después 
de ese condicionamiento, la insulina puede también liberarse como respuesta 
anticipatoria cuando los sujetos prueban edulcorantes artificiales, como la saca- 
rina. Si se ingiere un azúcar real (sucrosa o glucosa, por ejemplo), la insulina que 
se libera se utiliza en la digestión del azúcar. Sin embargo, si el sujeto ingiere 
solamente sacarina, la insulina que se libera no se utiliza, porque no hay azúcar 
que digerir. Por tanto, la ingestión de sacarina produce cantidades excesivas de 
insulina en circulación. Esto origina una caída del nivel de azúcar en la sangre, y 
da lugar a la sensación de «embriaguez» que algunas personas tienen después de 
tomar una bebida dietética con el estómago vacío. Curiosamente, el descenso del 
nivel de azúcar en la sangre, que es una respuesta condicionada por el sabor dulce, 
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puede extinguirse si el sujeto se expone durante un tiempo largo a edulcorantes 
artificiales (Deutsch, 1974). Ya que no se requiere insulina para la digestión de la 
sacarina, la liberación de insulina que sigue a la ingestión de sacarina se extingue 
con una exposición larga a la sacarina. 


2, ? El control de la sensibilidad al dolor 


Un segundo sistema fisiológico que puede estar influido por el condiciona- 
miento clásico es el de los mecanismos neurológicos que intervienen en la percep- 
ción del dolor. En el capítulo 4 vamos a describir los resultados de los experimen- 
tos de condicionamiento clásico en los que se utilizan como estímulos incondicio- 
nados drogas analgésicas, como la morfina. También se puede reducir la 
sensibilidad al dolor mediante la exposición a situaciones dolorosas o estresantes. 
El cerebro posee sus propias sustancias analgésicas, llamadas «endorfinas», que se 
liberan por exposición al estrés (por ejemplo, Willer, Dehen y Cambier, 1981). 
Curiosamente, la liberación de estas sustancias analgésicas endógenas, o internas, 
puede condiciomarse a los estímulos que señalan la presentación de un estímulo 
aversivo. Fanselow y Baackes (1982), por ejemplo, administraron una descarga 
eléctrica a ratas en una cámara especial, y después midieron el miedo condicio- 
nado (indicado por la paralización de las ratas) y la sensibilidad al dolor cuando 
las ratas eran expuestas de nuevo a la misma situación ambiental (colocadas en la 
caja). La exposición a los estímulos condiciona a descarga provocaba miedo 
y reducía la sensibilidad al dolor. Estos resultados no se obtenían cuando las ratas 
se exponían a estímulos que no se habían condicionado a la descarga. Investiga- 
ciones posteriores indican que la reducción de la sensibilidad al dolor estimulada 
por la exposición a un estímulo condicionado al miedo, estaba originada por los 
mismos procesos neurofisiológicos que se activan con una inyección de morfina 
(véase también Chance, 1980; MacLennan, Jackson y Maier, 1980; Oliverio y Cas- 
tellano, 1982). 


La supresión del sistema inmune 


El sistema inmune interviene en la movilización de las defensas fisiológicas 
contra los gérmenes y Otras sustancias extrañas que a veces entran en el cuerpo, 
con el fin de que esas sustancias no causen ninguna enfermedad. Tradicional- 
mente, el sistema inmune se ha considerado independiente del sistema nervioso. 
Es decir, se suponía que la producción y liberación de anticuerpos eran el resul- 
tado de reacciones químicas y hormonales, y no una actividad neurológica. Este 
punto de vista sobre el sistema inmune como independiente del sistema nervioso 
está siendo desafiado por investigaciones recientes, que indican que la presenta- 
ción de un estímulo condicionado puede influir en el sistema inmune. Puesto que 
los estímulos condicionados actúan a través del sistema nervioso, esos resultados 
sugieren que el sistema inmune está sujeto a un control neurológico. 

Las investigaciones sobre modificaciones condicionadas del sistema inmune 
son una continuación de los trabajos sobre el condicionamiento de aversión al 

_sabor. Como ya advertimos antes, la aversión a los sabores se condiciona expo- 
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niendo a los animales a sabores nuevos, seguidos de una experiencia aversiva. 
Una amplia variedad de drogas pueden ser inyectadas para proporcionar la expe- 
riencia aversiva (Gamzu, 1985). Una droga que resulta particularmente eficaz 
para producir aversiones condicionadas a sabores en las ratas es la ciclofosfamida. 


Un efecto tisiológico importante de la ciclofosfamida es que suprime el sistema 


inmune, haciendo a los sujetos más propensos a la enfermedad al interferir con la 
producción de anticuerpos. En una serie de elegantes experimentos, Robert Ader 
y sus colaboradores han mostrado que la supresión del sistema inmune puede 
también producirse como respuesta condicionada a un estímulo del sabor previa- 
mente condicionado con ciclofosfamida (véase una revisión en Ader, 1985). En 
cierto experimento (Ader, Cohen y Bovbjerg, 1982), por ejemplo, se les dejó a las 
ratas que bebieran primero una solución de sacarina y después se les inyectó 
ciclofosfamida. Unos días después, se les inyectó un tejido extrañio (células san- 
guíneas de oveja), y se midió la producción de anticuerpos en respuesta a la 
introducción de esos «gérmenes». St las ratas se exponían de nuevo al estímulo 
condicionado de la sacarina, su respuesta inmune ante tejidos extraños resultaba 
suprimida. El estimulo condicionado suprimía la producción de los anticuerpos 
que combartían a las células sanguíneas extrañas. Otra investigación demostró que 
esos efectos de inmunosupresión condicionada podían extinguirse utilizando-e. 
procedimiento normal de extinción pavloviano de presentar repetidamente él EG 
del sabor solo, sin ef ED de la droga (Bovbjerg, Ader y Cohen, 1984). (Véase ctra 
interesante aplicación de la inmunosupresión condicionada en Ader y Cohen, 


1982.) 


“+ Aversión a la comida en los humanos 


El aprendizaje de la aversión a los sabores y el de la preferencia de sabores, 
como ejemplos de condicionamiento pavloviano, han sido investigados extensa- 
mente en diferentes especies animales (véase Riley y Tuck, 1985). Existen cada 
vez más pruebas de que muchas aversiones a los sabores en los humanos son el 
resultado de un condicionamiento pavloviano. Muchas pruebas de que se da 
aprendizaje de aversión al sabor en los humanos han sido suministradas por los 
resultados de encuestas (Garb y Stunkhard, 1974; Logue, Ophir y Strauss. 1981; 
Logue, 1985). Muchas personas informan que han adquirido, al menos, uña avet- 
sión a la comida a lo largo de su vida. Curiosamente, las personas informan sobre 
unas circunstancias de aprendizaje de aversión a la comida que son, a menudo, 
comparables a las circunstancias que se ha demostrado que facilitan el aprendizaje 
de la aversión en los animales. Por ejemplo, es más probable que las aversiones 
provengan de un anterior emparejamiento « de la cómida con una enfermedad sub- 
siguiente, que de un  emparejamiento simultáneo o hacia atrás. Como en los expe- 
rimentos animales, las aversiones se aprenden a menudo en un solo ensayo, y el 
aprendizaje puede darse incluso si la enfermedad se retrasa hasta varias horas 
después de la ingestión de la comida. Otro aspecto interesante de los resultados es 
que en una elevada proporción de casos (el 21 por 100), los sujetos estaban segu- 
ros de que su enfermedad no estaba causada por la comida que habían tomado. 
Sin embargo, aprendieron una aversión a la comida. “Éstos hallazgos indican que 
el aprendizaje de aversión a la comida en las personas puede ser ande pendiente de 
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los procesos de pensamiento racionales, y puede ir en contra de las conclusiones 
de una persona sobre lás causas de su enfermedad. (Para una demostración expe- 
rimental reciente del aprendizaje de la aversión al sabor en los humanos, véase 
Cannon, Best, Batson y Feldman, 1983.) 

El hecho de que las aversiones a la comida se puedan adquirir con comidas 
nuevas tomadas antes de que se produzca la enfermedad, incluso cuando la 
enfermedad no está causada por la comida, puede crear problemas serios. Una 
forma común de tratamiento del cáncer es la quimioterapia, que implica tomar 
grandes dosis de drogas que debilitan al paciente. Los procedimientos de la qui- 
mioterapía causan, con frecuencia, náuseas como efecto secundario, Esto aumenta 
la posibilidad de que los procedimientos de quimioterapia condicionen aversiones 
a la comida ingerida antes de una sesión terapéutica, aun en el caso de que el 
paciente se dé cuenta de que su enfermedad no está causada por la comida. Inves- 
tigaciones recientes indican que esto es lo que de hecho ocurre. Se ha observado 
que los pacientes de cáncer adultos, y los niños, adquirían aversiones a un sabor 
concreto de helado cuando este sabor se ingería antes de una sesión de quimiote- 
rapia (Bernstein, 1978; Bernstein y Webster, 1980). Estos resultados sugieren una 
explicación a la falta de apetito que hallamos, por lo general, entre los pacien- 
tes con quimioterapia. La falta de apetito, o anorexia, puede reflejar aversiones 
aprendidas a comidas ingeridas antes de las sesiones de terapia. Este análisis, que 
recurre al condicionamiento pavloviano, sugiere que parte de la anorexia puede 
ser prevenida modificando los horarios de comida de acuerdo con las sesiones de 
terapia, y utilizando comidas que les resulten muy familiares y suaves, de forma 
que no se asocien con la enfermedad subsiguiente (véase capítulo 4). 


La terapia de avertión al alcohol 


Como indica la investigación sobre el aprendizaje de aversión al sabor, las 
personas pueden adquirir aversiones intensas al sabor de uma comida concreta si 
este sabor se empareja con una enfermedad subsiguiente. El aprendizaje de una 
aversión de este tipo puede resultar problemático, como en los pacientes con 
quimioterapia. El condicionamiento aversivo puede también ser beneficioso. Una 
aplicación terapéutica importante del condictonamiento aversivo es la terapia de 
aversión al alcohol. El tratamiento de aversión condicionada para el alcoholismo 
surge en 1935 en el hospital Shadel de Seattle, en Washington (véase Lemere y 
Voegtlin, 1950). Sin embargo, hasta hace diez años el procedimiento no se ha 
usado extensamente (véase Elkins, 1975, para una revisión). 

El procedimiento básico de la terapia de aversión al alcohol es emparejar el 
olor y el sabor del alcohol con la náusea. La náusea está originada por la inyección 
de una droga (normalmente la emetina). Inmediatamente antes de que se pro- 
duzca la náusea, se le pide al paciente que huela y que pruebe varias bebidas 
alcohólicas. En un procedimiento habitual se llevan a cabo cinco ensayos de condi- 
cionamiento, con un día de descanso para separar los sucesivos tratamientos. Se le 
pide al cliente que vuelva para recibir un ensayo de condicionamiento de apoyo 
dos o tres semanas después de los ensayos iniciales. Periódicamente, durante el 
año siguiente, se llevan a cabo otros ensayos según lo requiera el progreso del 
cliente. 
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El condicionamiento aversivo ha logrado un éxito notable en el tratamiento 
de la ingestión excesiva de alcohol, pero mo funciona con todos los que buscan 
ayuda. Lemere y Voegtlin (1950) informaron que el 60,5 por 100 de los pacientes 
permanecieron abstemios un año, y el 38,5 por 100 permanecieron abstemios 





cinco años o más. En una evaluación más reciente (Wiens y Menustik, 1983), se - ; 


halló. que el 63 por 100 permanecían abstemios un año, y un tercio tres años. 
Tanto los hombres como las mujeres respondieron igualmente' bien al trata- 
miento; el éxito no depende del nivel de educación, del estatus en el empleo, del 
tipo de empleo, ni de la historia anterior de tratamiento pot alcoholismo. Sin 
embargo, los hombres mayores tenían más probabilidades de mejorar que los 
jóvenes, y los hombres casados respondían mejor»al tratamiento que los solteros 
(véase estudios experimentales sobre la terapia de aversión al alcohol, por ejem- 
plo, en Boland, Mellor y Revusky, 1978; Carinon y Baker, 1981). 


La conducta emocional 


Un área de interés en la que el condicionamiento clásico ha tenido un papel 
importante es el estudio de la conducta emocional. De hecho, durante algún 
tiempo se consideró que el condicionamiento clásico intervenía exclusivahnente en 
el aprendizaje de las respuestas glandulares y emocionales. Las investigaciones 
recientes sobre fenómenos tales como el seguimiento del signo han ensanchado 
nuestra concepción del condicionamiento clásico. Sin embargo, persiste la idea de 
que el condictonamiento clásico es importante en la conducta emocional. Si lo 
hemos pasado bien con alguien, el véase a esa persona y oír su voz puede llegar a 
suscitar en mosotros reacciones emocionales agradables. Si un perro nos muerde, 
véase y oír perros puede llegar a provocarnos miedo y emociones desagradables. 


Los principios del condicionamiento clásico han aportado los fundamentos de ' 


gran parte de las investigaciones clínicas sobre respuestas emocionales problemá- 
ticas. El condicionamiento clásico ha tenido un papel fundamental en dos aspectos 
de la psicopatología de las emociones. En primer lugar, se supone a menudo que 
el condicionamiento clásico es el proceso subyacente responsable de la adquisición 
de los miedos patológicos, las fobias, las hostilidades. En segundo lugar, con fre- 
cuencia se utiliza como base .para.el desarrollo de los procedimientos de trata- 
miento. Si los miedos y las fobias problemáticas son de hecho respuestas condi- 
cioñadas, entonces deberíamos ser capaces de aplicar los principios del aprendiza- 
je para modificarlas. (Para una discusión más detallada del papel del condiciona- 
miento clásico en la psicopatología, véase Levine y Sandeen, 1985; O'Leary y 
Wilson, 1975.) 


a 
+ o. . Po. . . 

El condicionamiento clásico y el desarrollo de las fobias. Una fobia es un 
miedo intenso para el que, generalmente, no existe una base racional. Una per- 


- sona puede experimentar un miedo intenso al véase una serpiente enjaulada. No 


existe un peligro real, pero la sensación de miedo puede ser tan intensa como en 
una situación verdaderamente amenazante. Ese miedo irracional puede ser extre- 


madamente debilitante. Por ejemplo, algunas personas temen tanto salir de casa - 


(agorafobía), que permanecen enclaustradas durante años. 


(agoratobía), que permanecen enciaustradas durante años. 


AAA AAA 


PAS 
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En 1920, Watson y Raynor mostraron que un miedo «irracional», o fobia, 
podía condicionarse en un niño de once meses, conocido como Albertito. Empare- 
jaron un sonido fuerte con la presentación de una rata blanca. Inicialmente sólo el 
sonido fuerte provocaba miedo y llanto en Albertito. Después de siete empareja- 
mientos, Albertito también se mostraba temeroso con la rata. Á partir de esta 
simple demostración, muchos investigadores se han interesado en aclarar el papel 
del condicionamiento clásico en el desarrollo de las fobias (para una revisión, 
véase Emmelkamp, 1982a). Varios investigadores han intentado condicionar 
miedos de forma muy similar a la de Watson y Raynor, pero obtuvieron un éxito 
variable. Por razones obvias, este método experimental no ha sido muy popular. 
Pocos estudiantes se prestan como voluntarios para convertirse en fóbicos. 

Un segundo enfoque que se ha utilizado para estudiar el papel del condicio- 
namiento clásico en las fobias consiste en examinar la experiencia anterior de las 
personas con fobias, para comprobar la existencia de algún incidente que favo- 


a 


rezca el condicionamiento clásico. Los resultados de esta clase de investigación 
han sido asimismo variables. Á menudo se puede identificar un hecho que parece 
haber precipitado la fobia. Levine y Sandeen (1985), por ejemplo, describen a . 
un hombre que adquirió un miedo intenso a los lugares altos. Su oficio le obligaba 
a trabajar sobre andamios a gran altura. Su fobia interfería con su trabajo y tam- 
bién le impedía coger vacaciones porque tenía miedo a cruzar los puentes o de 
volar en avión. La fobia del hombre parecía provenir de un accidente en el que 
casi se cae de un andamio colocado a gran altura. Fue capaz de subirse de nuevo 
en el andamio, pero sólo después de haber estado suspendido a 30 metros del 
suelo. En otro experimento, Goldstein y Chambless (1978) examinaron 36 sujetos 
fóbicos, y hallaron que sólo en 17 casos las fobias podían achacarse a un hecho 
identificable que favoreciera el condicionamiento clásico. Así pues, en muchos 
casos no se pueden identificar experiencias de condicionamiento relacionadas con 
upa fobia. Sin embargo, como vamos a ver, esto no quiere decir necesariamente 
que el condicionamiento clásico no sea importante en esos casos. 

Un tercer enfoque para examinar el papel del condicionamiento clásico en la 


de fobías es investigar las situaciones de la vida real.en que se pueden 
desarrollar miedos o fobias. Lewis (1942), por ejemplo, estudió la incidencia de 
neurosis después de los ataques aéreos en Inglaterra. En otro estudio, Parker 
(1977) buscó fobias a las tormentas entre personas que habían tenido la experien- 
cia de vivir un ciclón. Esos estudios indican que un hecho traumático mo es sufi- 
ciente para adquirir una fobia. En términos generales, la mayoría de los sujetos de 
tales estudios sobre hechos traumáticos mo desarrollaron fobias debilitantes. 
Las investigaciones descritas hasta ahora han suministrado pruebas equívocas 
sobre el papel del condicionamiento clásico en la adquisición de fobias. En algu- 
nos casos, el condicionamiento clásico interviene de forma notable. Sin embargo, 
no todos los casos de fobias podrían achacarse a una experiencia de condiciona- 
miento, ni todos los hechos traumáticos conducen a la adquisición de fobias. Estos 
resultados, en general, no son sorprendentes dada la naturaleza del condiciona- 
miento clásico y los problemas para recoger información fiable de los pacientes 
fóbicos. Como veremos en el capítulo 4, no todos los estímulos emparejados con 
un El llegan a provocar una respuesta condicionada. Existen además muchos 
otros factores que rigen el condicionamiento clásico. En el capítulo 4 vamos a 
describir aquellos factores que han sido identificados mediante investigación ani- 











5 La terapia de conducta para los miedos y la ansiedad. Ya se ha descrito 
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mal, En la investigación con sujetos humanos se han identificado algunos otros 
factores importantes para la adquisición de fobias. Hugdahl, Fredrickson y 
Ohman (1977) sugirieron que las personas con un nivel general de activación alto 
son más propensas a desarrollar fobias que las que poseen niveles de activación 
más bajos.-Otros investigadores han propuesto que la susceptibilidad a lás fobias 
se relaciona con factores cognitivos. Es decir, ciertos individuos se vuelven fóbicos 
por la forma en que interpretan los acontecimientos del ambiente (véase Ellis, 
1962; Galassi, Frierson y Sharer, 1981). Estas consideraciones sugieren que el 
desarrollo de las fobias es un femómeno multifacetado (Mineka, en prensa). 

Otro problema importante para estudiar los efectos del condicionamiento clá- 
sico es que los individuos fóbicos, a' veces, tienen una gran dificultad para récordar 
hechios importantes. El hombre con miedo a las alturas que hemos descrito ante- 
riormente, no se acordaba del grave accidente que sufrió hasta que no llevaba un 
tiempo de terapia. El incidente fue reprimido, de forma que el individuo fue 
incapaz de discutirlo abiertamente hasta que liberó parte de su ansiedad. Varios 
estudios recientes ham mostrado efectos paralizantes similares debidos a un 
trauma. Resick (1983) describe algunas investigaciones con víctimas de violacio- 
nes. Las víctimas de violaciones con frecuencia tienen miedo de quedarse solas, de 
la oscuridad, de los hombres extrafios, y de estímulos especificos como un olor o 
una camisa de un color determinado, que van asociados al ataque que sufrieron. 
En los estudios con víctimas de violación se documentan efectos traumáticos seve- 
ros que afectan a muchas facetas de la conducta emocional y social durante perío- 
dos que oscilan entre un mes y varios años. Inicialmente, el terror y la depresión 
pueden ser tan fuertes que la terapia no sea eficaz para proporcionar alivio. Sólo 
después de varios meses parecen ser útiles las terapias de tratamiento de la anste- 
dad. Kidd y Chayet (1984) han sugerido que esta parálisis emocional puede ser un 
factor a tener en cuenta en el hecho de que las mujeres no acudan a las autorida- 
des a denunciar los ataques. Es difícil determinar hasta qué punto esta represión 
de un incidente traumático es un problema para los estudios que buscan en el 
condicionamiento clásico una causa de las fobias. 


a 


anteriormente una aplicación terapéutica del condicionamiento clásico, la terapia 
de aversión al alcohol. En la terapia de aversión al alcohol, el objetivo es condi- 
cionar una respuesta negativa al alcohol. En los procedimientos que vamos a 
describir aquí, el objetivo es eliminar, o al menos reducir, las respuestas emocio- 
nales de ansiedad o de miedo. Si un estímulo condicionado concreto provoca una 
respuesta de miedo intensa, un enfoque simple, desde un punto de vista concep- 
tual, para reducir esa respuesta, sería extinguir el EC. Esta idea es la que subyace 
en la terapia de inundación. Para la inundación se requiere básicamente que el 
individuo se expongá al estimulo que provoca miedo sin que exista ningún peli- 
gro. Si el sujeto se expone al estímulo en unas condiciones de seguridad durante 
un periodo de tiempo largo, se debería de producir la extinción. A una persona 
que tiene miedo a las alturas, por ejemplo, se la puede llevar a un puente y 
pedirle que se quede allí un rato. En una variante del procedimiento de inunda- 
ción, gradualmente se expone al individuo a los estímulos que producen miedo. 
Un agorafóbico (una persona que tiene miedo de salir de casa), por ejemplo, 
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puede primero quedarse de pie delante de la puerta de a. d e A] 
puede aventurarse a salir a la acera y más tarde andar por A calle. o pipa 
procedimiento podría consistir en llevar al cliente a un lugar público de $ 
ión, como Un Circo. e 
dea técnica para reducir el miedo y la ansiedad, la Oia 
sistemática, es probablemente el procedimiento más importante A ca a 
conducta que se ha desarrollado. El método fue originariamente qu , a E 
creador, Joseph Wolpe, como ejemplo de contracondicionamiento, E 
condicionamiento que vamos a describir en el capítulo 4. Básicamente, la e 
que los estímulos elicitantes de miedo queden condicionados a respueras ae 1 
incompatibles con el miedo. Normalmente esas respuestas son 5 e a z 
ATpaciente se le entrena primero a relajarse. Cuando ya . iO a E E 
presentan de forma jerarquizada los estímulos elicitantes de mie E S ea 
que sólo suscitan un ligero miedo se presentan primero y repeti on A 
que el paciente se quede completamente relajado en su aa se o o 
para desensibilizar a una persona con fobta a las dio E a P a 
en primer lugar, un dibujo estilizado de una serpiente sacada de un A e E A 
Después se le puede presentar un dibujo más realista. A eS ; Lo E 
incrementando el tamaño y la viveza de las serpientes. Una vez que a a e 
aprendido a relajarse en presencia de esos estímulos, se le puede prese 
dla sistemática y la inundación normalmente mi llevan, e 
usando estímulos imaginarios .y...RO. reales. Es decir, se le pide a po a ue 
imagine varios estímulos elicitantes de miedo mientras ren . ) e E 
desensibilización y la inundación con estímulos de la vida E o im a = 
les llama, presentan con frecuencia problemas logísticos. Si OS an a. 
realizan con estímulos imaginarios, el terapeuta y el o no Sr a ds 
tar zoos, puentes, edificios altos y demás. A pesar de que los a A o 
rios se pueden utilizar con un éxito considerable, las e a 
muestran que los procedimientos +7 v:v0 SON mucho más eficaces cp 


ejemplo, Emmelkamp y Wessels, 1975; Sherman, 1972). 


Se ha descubierto que la desensibilización sistemática y la inundación son . 


extremadamente útiles para el tratamiento de la ansiedad y el miedo. La a 
bilización sistemática es quizás el procedimiento terap eee toa lie de 
utilizado en la práctica clínica normal. Las investigaciones indican as Pe 
la desensibilización y de la inundación se debe a componentes o l isa 
procedimientos, no a un efecto terapéutico general y crpal EN 
1980). No se entiende bien, sin embargo, por qué eE Eb E 
Por ejemplo, algunos han puesto en cuestión que la ceo i e EAS 
implique de hecho el condicionamiento de las respuestas de Se a) Datcos se 
mulos elicitantes de miedo, y han sugerido que loy resultados te E discu- 
deben a la simple extinción del miedo (véase Emmelkamp, 1982, P bg EE Aba 
ción más detallada). Sin embargo, la desensibilización sistemática y RON ao 
son procedimientos terapéuticos importantes que se 1nspiraron en €l P 8 


del condicionamiento clásico. 
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COMENTARIOS FINALES 


Como ya se ha visto, los procesos de condicionamiento clásico intervienen en 
una gran variedad de aspectos importantes de la conducta. Dependiendo del pro- 
cedimiento que se use, el aprendizaje puede ocurrir de forma rápida o lenta, Con 
algunos procedimientos se aprenden tendencias de respuesta excitatoria, mientras 
que con otros los sujetos aprenden a inhibir una respuesta concreta en presencia 
del estímulo condicionado. Las dos modalidades de aprendizaje implican una rela- 
ción de señal entre los estímulos condicionado e incondicionado. Los organismos 
pueden aprender que un EC señala ía presentación inminente del El o la ausencia 
transitoria del El. Por último, si el estímulo condicionado se presenta de forma 
repetida sin el El después del condicionamiento, se extinguirá y perderá prácti- 
camente toda su capacidad de elicitar una respuesta. 








Capítulo 4 
EL CONDICIONAMIENTO CLASICO: MECANISMOS 


El capítulo 4 describe más detalladamente los factores que influyen en la for- 
mación de una asociación entre dos estímulos. La discusión está organizada en 
tres partes. En primer lugar, vamos a describir qué convierte a los acontecimien- 
tos ambientales en estímulos condicionados e incondicionados eficaces. Después 
vamos a discutir qué es lo que determina la naturaleza de las respuestas que 
llegan a condicionarse mediante condicionamiento clásico. La sección tercera y 
última describe los mecanismos que intervienen en la formación de asociaciones 
entre estímulos condicionados e incondicionados. : 


¿A QUE DEBEN SU EFICACIA LOS ESTIMULOS CONDICIONADOS E 
INCONDICIONADOS? 
La respuesta inicial a los estímulos 
La novedad de los estímulos condicionados e incondicionados 
La intensidad del EC y del El 
La relevancia del EC-El o pertinencia 
La relevancia del estímulo en el condicionamiento aversivo 
Generalidad de la relevancia de los estímulos 
Importancia de la semejanza entre EC y El 
El concepto de fuerza biológica 
El condicionamiento de orden superior 
El contracondicionamiento 
El precondicionamiento sensorial 
La fuerza biológica diferencial como ayuda para medir el aprendizaje 
más que para producirlo 
Las diferencias en los mecanismos de aprendizaje en relación con la fuerza 
biológica 
¿QUE DETERMINA LA NATURALEZA DE LA RESPUESTA CONDICIO- 
NADA? 
El modelo de sustitución del estímulo 
El El como factor determinante de la RC 
Dificultades con el modelo de sustitución del estímulo 
Enfoques modernos de la sustitución del estímulo 
Aprendizaje E-E frente a aprendizaje E-R 
Aprendizaje E-E frente a aprendizaje E-R en el condicionamiento de 
segundo orden 
El modelo de la respuesta compensatoria 


a 


El EC como determinante de la forma de la RC 


La RC como interacción entre los procesos conductuales innatos y condicionados 
Un enfoque funcional-adaptativo de la RC 


¿COMO SE ASOCIAN LOS ESTIMULOS CONDICIONADOS E INCONDI- 


CIONADOS? 

Dos concepciones del proceso de adquisición 

El efecto de bloqueo 

El modelo de condicionamiento de Rescorla- Wagner 
Modelos alternativos de reducción del El 

Modelos de modificación del EC 


COMENTARIOS FINALES 
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¿A QUE DEBEN SU EFICACIA LOS ESTIMULOS CONDICIONADOS 
E INCONDICIONADOS? 


Quizá la cuestión fundamental que hay que plantearse acerca del condiciona- 
miento clásico sea: ¿por qué unos estímulos son eficaces como estímulos condi- 
cionados y otros como estímulos incondicionados? Tradicionalmente los investi- 
gadores occidentales se han interesado por la forma en que las diversas relaciones 
temporales y de señal entre los estímulos condicionado e incondicionado influyen 
en el condicionamiento clásico. El problema —a qué deben su eficacia los estimu- 
los condicionados e incondicionados— fue planteado originariamente por Pavlov, 
y en la actualidad atrae cada vez más la atención de los investigadores. 


La respuesta inicial a los estímulos 


Pavlov ofreció una respuesta parcial a la cuestión de «a qué deben su eficacia 
los «estímulos. condicionados e incondicionádos» dentro de su definición de los 


términos «condicionado» e «incondicionado». e acuerdo. cOn. esas, definiciones. el 
“estímulo condicionado es el que inicialmente no provoca la respuesta córidicio- 
nada pero. comienza a hacerlo con el entrenamiento, Por, el contrario, el estímulo 
incondicionado és" aquel capaz de provocar esa respuesta sin un entrenamiento 
Especial, Es importante advertir que esas defiriiciones se establecen en términos 
de la elicitación de una respuesta concreta, aquella que se va a condicionar. Ántes 
del condicionamiento el estímulo condicionado normalmente no es totalmente 
ineficaz. Provoca una respuesta de orientación y, quizá, también otras. Sin 
embargo, en un principio no elicita la respuesta que se va a condicionar. 
Debido a que Pavlov definió los estímulos condicionados e incondicionados en 
términos de la elicitación de una respuesta concreta, la identificación potencial de 
los ECs y los Els implica comparar las respuestas suscitadas por cada uno de ellos 


“antes del condicionamiento. Esta comparación da lugar a que consideremos rela- 


tiva la identificación de los ECs y los Els. Un estímulo concreto puede hacer de 
EC en relación con unos estímulos y de El en relación con otros. Pensemos, por 
ejemplo, en una solución de sacarina para ratas sedientas. Este estímulo puede 
servir como estímulo «condicionado» en un experimento de aversión a.los sabo- 
res, empleando como El una enfermedad. En este caso, los ensayos de condicio- 
namiento consistirían en que los animales probaran el sabor de la sacarina 
seguida de la inyección de una droga que induce la enfermedad, y el animal 
aprendería a dejar de beber la solución de sacarina. Una solución saboreada con 
sacarina puede servir también de estímulo «incondicionado» en un experimento 
de seguimiento del signo, por ejemplo. Los ensayos de condicionamiento en este 


caso podrían consistir en que se encendiera una luz inmediatamente antes de cada 


MC Y 


Ys 
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presentación de una pequeña cantidad de sacarina. Después de varios ensayos de 
este tipo, el animal comenzaría a acercarse al EC de la luz. Así pues, que la 
solución de sacarina se considere EC o El depende de su relación con otros estí- 
mulos de la situación. En el experimento de seguimiento del signo la solución de 
condicionamiento. En el experimento « de aversión al sabor, la solución de sacarina 
hace de EC porque provoca la respuesta condicionada (retirada o aversión) sólo 
cuando se ha emparejado con la enfermedad. 


a 
La novedad de los estímulos condicionados a incondicionados 


A 


Quer un estímulo provoque la respuesta Que nos interesa al principio del con- 


PEA Ta as A 


dicionamiento es sólo uno de los distintos factores que determinan la eficacia de 
los estímulos condicionados e incondicionados. Como ya vimos en los estudios de 
habituación, el impacto que un estímulo tiene sobre la conducta depende en gran 
parte de su novedad. Los -muy familiares no suelen provocar reacciones . 
tan intensas cómo los estímulos novedosos. La novedad también es muy impor- 
“tánte er el condicionamiento clásico. Si uno de los dos estímulos, el condicionado 
o el incondicionado, resulta muy familiar, el condicionamiento pavloviano se desa- 
rrolla mucho más. lentamente que si el EC y el El son novedosos. 





Ao ar 


a se Meal a cabo.en. 1 dos fases, En los” experimentos en 1ós: que el es 


Prollema se centra en la.novedad del._EC,. por ejemplo, los animales experimen- 


"tán primero de forma repetida: al estímulo. que. después. se utilizará como EC. . 


Diirante esta fase, inicial del experimento, el futuro EC.se presenta siempre > solo. 
Después de esta familiarización con el estímulo, el EC se empareja con el estí- 
mulo incondicionado utilizando los procédimientos de condicionamiento clásico 


convencionales. Los animales que han experimentado repetidamente : el EC antes... $ 


del condicionamiento súelén “apferider : la: ¡réspuesta condicionada más lentamente 


que Jos-animalés para 103 que el. EC es nuevo; Esté féñómeno:se Hanasefecto de *: 


_preexposición-al'EC"0'dermhibición. latente (Lubow y Moore, 1959). Las, expe- 
"TÍMentos, quentratanrel: problema de la novedad del El se llevan a cabo de forma 
“Similar a los experimentos de preexposición al EC. En la primera fase del estudio,. 
los animales son repetidamente expuestos a un. El,.que se presenta solo, y 
empereja-conun un.estímulo-condicionado. y se controla el progreso en el aprendi- 
zaje. Los animales familiarizados con un estímulo incondicionado son más lentos ' 
para asociar el El con úl estímulo condicionado que los animales para"los que el 
El es e en ese condicionamiento. Esté resultado se llama efecto.de preexpo- 
sición al EL (Baker, Singh y Bindra; 1985; Randich y Lolordo, ed Randich y 
Ross, 1985). pi 2 > 
Los mecanismos de los efectos de la preexposición a los mulas condicio- 
nado e incondicionado han sido tema/ de extensas investigaciones y debates. Aun- 
que se han propuesto varios mecanismos, hay dos que son especialmente ¡ impor- 
tantes. Uno se centra en el hecho de que durante la preexposición el sujeto_se 
expone de forma repetida al. EC o al El en presencia de unas claves de fondo (por 
ejemplo, las claves de la cámara experimental). La hipótesis sostiene que las pre- 
sentaciones del EC o del El en una situación concreta dan lugar al aprendizaje de 
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una asociación entre el EC y el El y las claves de fondo de esa situación. Se supone 
que esa asociación interfiere con el aprendizaje subsiguiente de una asociación 
entre el EC y el El (por ejemplo, Wagner, 1976). Así pues, este primer meca- 


DISmmo atribuye l los efectos de la preexposición al EC y al El al aprendizaje de 


asociaciones .interferentes - durante la. preexposición. El segundo mecanismó se 
centra en el hecho de que la preexposición al EC o al El implica presentar repeti- 
damente el estírmiilo solo. Dado que el estímulo preexpuesto se presenta solo, se 
suponé que los'stijetos aprenden que el EC o el El no están relacionados con nada 
significativo. Se supone qué éste aprendizaje de la irrelevancia altera el posterior 


aprendizaje de que el EC señala el El (por ejemplo, Baker y Mackintosh, 1977). 


Se han obtenido pruebas tanto de la hipótesis de la interferencia asociativa como 
de la de irrelevancia aprendida, lo que sugiere que ambos procesos son parcial- 
mente responsables de los efectos de la preexposición (por ejmeplo, Baker y Mer: 
cier, 1982; Baker, Mercier, Gabel y Baker, 1981; Channell y Hall, 1983; Hinson, 
1982; Randich, 1981). 


La intensidad del EC y del El 


Otra variable del estímulo importante para el condicionamiento clásico es la 
intensidad de los estímulos condicionado e incondicionado. La mayoría de los 
efectos biológicos y fisiológicos de la estimulación están directamente relaciona- 
dos con la intensidad del suceso estimular. Lo mismo ocurre en el condiciona- 
miento. Cuanto más intenso sea el estímulo que se utilice más rápidamente se 
producirá la “asociación entre el EC. y et El, y el grado de condicionamiento qué'se ** 


"consiga será mayor (por ejemplo, Kamin y Brimer, 1963; Kamin y Schaub, 1963). 


Está telación se observa en una amplia gama de intensidades de estímulo. Sin 
embargo, si la intensidad del EC o del El es demasiado alta, el condicionamiento 
puede trastornarse, probablemente porque los estímulos muy intensos provocan 
reacciones incondicionadas fuertes que pueden hacer que al animal le resulte difí- 
cil dar la respuesta condicionada. En los experimentos de condicionamiento clá- 
sico rara vez se emplean unas intensidades del EC y del El tan extremas. 

El hecho de que el aumento de la intensidad del EC y del El facilite el condi- 
cionamiento puede estar relacionado con la novedad de los estímulos condiciona- 
dos e incondicionados. Los animales y las personas rara vez se encuentran con 
estímulos muy intensos. Por tanto, los estímulos condicionados e incondiciónados 
de alta intensidad pueden resultar más novedosos que la estimulación de baja 
intensidad. La novedad puede sér la.responsable, parcialmente al menos,.de.los 
efectos de la intensidad del estímulo en el condicionamiento clásico (véase Kalat, 


1974). 


;, La releváncia del EC-El o pertinencia 


Ya hemos advertido antes que el hecho de que un estímulo sirva de EC suele 
depender del estímulo que hace de El y viceversa. La relación que discutlamos 


. antes hacía referencia a las respuestas iniciales al EC y al EL Otra relación que 
“determina la tasa: de condicionamiento clásico es la relevancia o pertinencia entre 
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el EC y el El Parece ser que ciertos estímulos condicionados se asocian más 
fácilmente con ciertos estímulos incondiciohados, mientras que otros EC se aso- 
cian más fácilmente con otros Els. Aparentemente, unos ECs son más relevantes, 
o_más pertinentes, para ciertos Els. o 


y e 
Ca 
EA yd 


La relevancia del estímulo en el condicionamiento aversivo, El'fenómeno de 
la relevancia EC-El fue demostrado claramente por primera vez por García y 
Koglling (1966) en uno de los experimentos ya clásicos de condicionamiento. 
Utilizaron dos clases de ECs (sabores y claves audiovisuales) y dos clases de Els 
(descarga eléctrica y enfermedad). El experimento, del que se ofrece un diagrama 
en la figura 4.1, consistía en que las ratas bebieran de un tubo antes de la adminis- 
tración de uno de los estímulos incondicionados. El tubo se llenaba de agua salada 
o dulce. Además, al lamer el tubo se activaba un estímulo audiovisual breve (el 
chasquido de un relé y un destello de luz). Así pues, el estímulo condicionado era 
complejo, en él intervenían componentes audiovisuales y de sabor. Después de 
estar expuestos a este EC complejo, los animales recibían una descarga a través de 


un suelo de rejilla metálica, o se les hacía enfermar exponiéndoles a una radiación 


o con inyecciones de una droga. 


Condici iento Prueba Figura 4.1.—Diagrama del expe- 
psa cal ; rimento de García y Koelling 


z 
(1966). Un estímulo compuesto 


Gustativo + Descarga Gustativo gustativo/audiovisual fue inicial- 
mente emparejado tanto con una 


audiovisual 
Audiovisual descarga como con malestar. 
Después, con esos mismos suje- 
tos, se utilizaron por separado 
Gustativo + Mal Gustarivo estímulos gustativos y audiovisua- 
sa —_—> alestar 
audiovisual po les. 
Audiovisual 


Dado :que todos los estímulos incondicionados utilizados eran aversivos, se 
esperaba que los animales aprendieran algún tipo de aversión. Después del condi- 
cionamiento, los experimentadores midieron la respuesta de los animales a los 
estímulos audiovisuales y al sabor por separado. Durante las pruebas de respuesta 
al EC de sabor, el agua tenía el mismo sabor que antes, pero ahora los lamidos no 
activaban el estímulo audiovisual. Durante las pruebas de respuesta al EC audiovi- 
sual, se le quitó el sabor_al agua, y cuando el animal bebía se presentaba breve- 
mente el estímulo, audiovisual. El grado de aversión condicionada al EC de sabor y 
al audiovisual se infería del grado de supresión en la conducta de beber. 

Los resultados del experimento se resumen en la figura 4.2. Antes de que se 
realizara este experimento, no existía ninguna razón para esperar que uno de los 


estímulos incondicionados fuera más eficaz que otro para condicionar aversión a: 


uno de los componentes del estímulo condicionado complejo. Sin embargo, esto 
fue precisamente lo que ocurrió. Los animales condicionados com una descarga 
'. r , a. . i A ó MS . 
suprimían mucho más la bebida en las pruebas con el estímulo audiovisual que en 
las. pruebas con el EC de sabor. Cuando los animaies fueron condicionados eon la 
enfermedad se produjo el resultado contrario. Estas ratas dejaban de beber mucho 
más cuando el EC del sabor estaba presente que cuando el beber producía estírmu- 


los audiovisuales. Así pues, se condicionaban aversiones más, intensas a las claves * 


audiovisuales: que.a.las claves de sabor cuando el El éra a. descarga eléctrica) y: se 


E O 


DA A CI KA + 
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Figura 4.2,— Resultados del ex 

E] Gustativo rimento de García y Koelliog 
3 Aióa (1966). Las. ratas condicionadas 
con el malestar aprendieron una 
mayor aversión hacia las claves 
de sabor que hacía las audiovi- 


3 a suales. Por el contrario, las ratas 
a condicionadas mediante descargas 
8 aprendieron mayor aversión pot 
2 las 10Vi 

$ claves audiovisuales que por 


las gustativas. 





Malestar Descarga 


condicionaban aversiones más fuertes a los sabores. que a las claves audiovisuales 
cuando el El éra una enfermedad igrerna. 

El experimento de García y Koelling demuestra, el principio de. relevancia o 
pertinencia, EC-El, En ese experimento el condicionamiento estaba determinado 
solamente por la combinación del EC y el El implicados en la asociación. Por 
ejemplo, generalmente el EC audiovisual no era más eficaz que el EC del sabor. 
Antes bien, el EC audiovisual era más eficaz sólo cuando la descarga hacía de El. 
Asimismo, el El de la descarga no era por lo general más eficaz que el El de la 
enfermedad. Antes bien, la descarga condicionaba aversiones más intensas que la 
enfermedad sólo cuando la clave audiovisual hacía de EC. La única forma de expli- 
car los resultados observados por García y Koelling es reconocer que ciertas com- 
binaciones de estímulos condicionados e incondicionados (sabor con enfermedad 
claves audiovisuales con descarga) se asocian más fácilmente que otras combina- 
ciones (sabores con descargas, claves audiovisuales con enfermedad). 

El efecto de la relevancia EC-El demostrado por García y Koelling se ha 
observado desde entonces en numerosos experimentos (véase una revisión re- 
ciente en Domjan, 1983). Algunos han sugerido que el efecto se produce sola- 
mente cuando, en un ensayo de condicionamiento, los sujetos experimentan 
simultáneamente el sabor y los estímulos audiovisuales antes del El. Sin embargo, 
el fenómeno aparece incluso cuando el animal experimenta sólo un estímulo con- 
dicionado u otro, no los dos, durante el condicionamiento (por ejemplo, Domjan y 
Wilson, 1972). El fenómeno también ocurre en las ratas un día después del naci- 


ña 


miento (Gemberling y Domjan, 1982). Este último hallazgo indica que para que 
- se produzca el fenómeno de la relevancia del estímulo no es necesaria una amplia 
experiencia con sabores, con la enfermedad, con claves audiovisuales y con el 


dolor periférico. Parece, más bien, que el fenómeno refleja una predisposición 
genética para ta asociación selectiva de ciertas combinaciones de ECs y Els. 
La relación de relevancia de los estímulos observada por García y Koelling se 
ha comprobado también en la conducta humana. Los estudios sobre las condicio- 
nes en que las personas aprenden las aversiones a lacomida indican que, not- 
malmente, esas aversiones se apreuden como resultado de una enfermedad, no 





: 


128 MICHAEL DOMJAN Y BARBARA BURKHARD 


como resultado de un accidente, tal como romperse un brazo o magullarse una 
rodilla. Además, la enfermedad tiene más probabilidades de condicionar aversio- 


nes a comidas que a estímulos no alimenticios como el lugar donde se tomó la j 


comida (Garb y Stunkhard, 1974; Logue y otros, 1981). 
Es importante advertir que el principio de la relevancia EC-El identificado 
por García y Koelling no significa que sean imposibles las asociaciones entre 


estímulos condicionados e imcondicionados que no son relevantes entre si. El ; 


experimento de Garcia-Koelling y otros estudios similares no se proponen mos- 


trar que las ratas no aprenden aversiones a los sabores emparejados con la des- ; 
carga o a las claves exteroceptivas emparejadas con la enfermedad. De hecho, se 4 


han demostrado las dos clases de asociación (por ejemplo, Best, Best y Henggeler, 
1977, Krane y Wagner, 1975; pero véase Hankins, Rusiniark y García, 1976). 


Antes bien, con la teoría de la relevancia de los estímulos se trata de demostrar que 


se aprenden más fácilmente. las asociaciones entre. los estímulos condicionados e 


incondicionados que son relevantes entre sí. que las asociaciones entre otras combi- 


naciones de estirilos condicionados e incondicionados. 


Generalidad de la relevancia de los estímulos. Durante varios años el efecto 
de la relevancia de los estímulos descrito arriba fue el único ejemplo conocido de 
relevancia EC-El en el condicionamiento clásico. En consecuencia, algunos teórt- 
cos sugirieron que la relevancia de los sabores para con la toxicosis, y de las claves 
audiovisuales para con la descarga eléctrica en la pata de las ratas, es una especia- 


APARTADO 4,1. La relevancia del estímulo y la modificación del bábito de fumar 


Dejar de fumar es una tarea difícil para los fumadores habituales. Se sabe sobrada- 
mente que el fumar cigarros es un hábito resistente a la modificación. Los intentos de 
condicionar aversiones a los estímulos relacionados con el acto de fumar por medio de 
varios agentes aversivos no ha tenido unos resultados particularmente buenos. El proce-. 
dimiento desarrollado por Lichtenstein y sus colaboradores (Schmahl, Lichtenstein y 
Harris, 1972) es una excepción. El procedimiento es coherente con el principio de relevan- 
cia del estímulo, pues se aprovechan las consecuencias maturales aversivas del fumar para 
condicionar una aversión. Se le pide al fumador que fume mucho y rápido hasta que el 
fumar se convierta en una cosa físicamente desagradable. Se le enseña a inhalar y exhalar 
una vez cada seis segundos hasta que llega un momento en que expulsar el humo causa 
vómitos, mareo y asfixia. Una vez que obtienen estas sensaciones desagradables directa- 
mente del fumar, sería de esperar un condicionamiento aversivo rápido al sabor del humo 
de cigarro (Erickson, Tiffany, Martin y Baker, 1983). Algunos investigadores han hallado 
que tres meses después del tratamiento el 60 por 100 de los pacientes mantienen su 
abstinencia (Bernstein y McAlister, 1976; Lichtenstein y Danaher, 1976). Aunque no per- 
fecros, los resultados son alentadores. 

Erickson y otros (1983) encontraron que el éxito de la terapia venía en parte determi- 
nado por el grado de malestar (intensidad del El) obtenido: Comparafon los resultados de 
fumar rápido y de exhalar rápido (sin inhalar). El exhalar produce menos malestar que el 

. fumar, pero mantiene el mismo EC del humo en la boca. Fumar rápido era la mejor forma 
de condicionar una aversión. Además, los resultados de la terapia estaban correlacionados 
con el grado de malestar del sujeto. 

Las reacciones físicas aversivas originadas por fumar rápido y en exceso se deben pro- 
bablemente a una forma suave de envenenamiento con nicotina, que podría entrafíar ries- 
gos. Hasta ahora no se conocen problemas por utilizar el procedimiento, son más o menos 
los riesgos normales que trae consigo el fumar cigarros. Sin embargo, no debería llevarse a 
cabo el procedimiento sin la aprobación de un médico. 
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lización adaptativa del aprendizaje (por ejemplo, Rozin y Kalat, 1971). Sin 
embargo, en investigaciones recientes se han descubierto otras relaciones de rele- 
vancia de los estímulos. Por ejemplo, LoLordo y sus colaboradores hallaron que 
las palomas asocian las claves visuales con la comida mucho más fácilmente de lo 
que asocian las claves auditivas con la comida. Por el contrario, si en la situación 
de condicionamiento hay una descarga eléctrica, las claves auditivas son mucho 
más eficaces como EC que las claves visuales. Así pues, en las palomas las claves! 
visuales son relevantes para con la comida y las claves auditivas son relevantes 
para con la descarga eléctrica (véase LoLordo, Jacobs y Foree, 1982; Shapiro: 
Jacobs y LoLordo, 1980; Shapiro y LoLordo, 1982). Podemos encontrar otra rela- 
cion interesante de relevancia del estímulo en el contraste entre el condiciona- 
miento excitatorio y el condicionamiento inhibitorio del miedo en las ratas. En el 


condicionamiento excitatorio, un sonido es mucho más eficaz que un EC visual, 


mientras que en el condicionamiento inhibitorio un EC visual es mucho más 
eficaz que un sonido (Jacobs y LoLordo, 1980; LoLordo, y Jacobs, 1983). 


Importancia de la semejanza entre EC y El. Aunque no hay duda de que la 
relevancia EC-El es un factor fundamental en el condicionamiento clásico, por el 


momento no se sabe a qué se debe que un EC sea relevante para con el El Una 


posibilidad prometedora es que la semejanza en el transcurso temporal de los 
estímulos condicionados e incondicionados es importante (Testa, 1974). Esta idea 
explica los resultados del experimento de García y Koelling mediante el supuesto 
de que los sabores y la enfermedad poseen cursos temporales similares, al igual 
que las claves audiovisuales y las descargas eléctricas. Los sabores se consideran, 
por lo general, estímulos de larga duración porque aunque se presenten breve- 
mente, suelen dejar un regusto o huella que desaparece lentamente. Esto ocurre 


sobre todo con ciertos sabores, como el del ajo o la cebolla. El sabor de la cebolla 


fresca permanece mucho tiempo después de haberla comido. La enfermedad indu- 
cida por radiación o por drogas es también de larga duración. La relevancia entre 
las claves audiovisuales y la descarga se puede explicar en términos comparables. 
Las claves audiovisuales son de corta duración y no dejan huella mucho tiempo. 
La descarga en las patas que se utilizó en estos experimentos fue también breve, y 
ésta es quizá la razón de que las claves audiovisuales se asocien rápidamente con 
la descarga. l 

La hipótesis de la semejanza EC - El ha sido difícil de comprobar en los expe- 
rímentos de condicionamiento aversivo debido a las dificultades para especificar y 
manipular experimentalmente el transcurso temporal de los estímulos del sabor y 
de la enfermedad. Aunque probablemente estamos en lo cierto cuando suponemos 
que los sabores y la enfermedad tienen una duración larga, no sabemos exacta- 
mente la duración que tiene cada uno de ellos en particular. Se han obtenido 
pruebas fiables de la hipótesis de la semejanza EC-El en otras situaciones de 
condicionamiento (por ejemplo, Rescorla y Cunningham, 1979; Rescorla y Furrow, 
1977; Rescorla y Gillan, 1980). Sin embargo, sigue siendo objeto de especulación 
que estos resultados se puedan aplicar a la relevancia del estímulo en el aprendi- 
zaje aversivo, 
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El concepto de fuerza biológica 


En todos los ejemplos de condicionamiento clásico discutidos hasta ahora, el 
EC no provocaba antes del condicionamiento respuestas tan intensas como el El. 
El caso del conocido condicionamiento salivar nos suministra un buen ejemplo. 
En esta situación, el estímulo condicionado (una campana) provoca inicialmente 
sólo movimientos de orientación. Por el contrario, el El (la comida) provoca un 
acercamiento grande, la ingestión, salivación, masticación, deglución, etc. Pavlov 
era consciente de la gran diferencia de «fuerza biológica» entre los estímulos 
condicionados e incondicionados existente antes de comenzar el condiciona- 
miento, y calculó la diferencia necesaria para seleccionar los estímulos como con- 


dicionados O incondicionados (Pavlow, 1927). Pavloy sugirió que ps UN, ae 


estímulo. se-condietonase- tenía «que ser. un estimulo biológico más d 
biofógico más débil» se refería a aquel que inicialmente provocara menos y más 
débiles respuestas. 
pa 
> MEl condicionamiento de orden superior. El criterio de Pavloy sobre los estí- 
mulos condicionados e incondicionados implica que un estímulo puede hacer el 
papel de estímulo incondicionado después de condicionarse. Considérese, por 
ejemplo, un tono que se empareja repetidamente con la comida. Tras un número 
suficiente de ensayos, el tono llega a provocar salivación. A causa de su asociación 
con la comida, el tono también llegará a producir reacciones biológicas más fuer- 
tes que los tonos o las luces movedosos. Provocará movimientos de orientación y 
respuestas de acercamiento y el animal generalmente se activará cuando se pre- 
sente el tono. Según Pavlov, el tono debería ser capaz de condicionar la salivación - 


a otros estimulos que inicialmente no provocan salivación. El emparejamiento- del. 


tono previamente condicionado con una luz novedosa, por ejemplo, debería dar 
como resultado el condicionamiento progresivo de la salivación a la luz. Este 
condicionamiento se observa con frecuencia y se le llama condicionamiento de 


orden superior. En la figura 4.3 se ofrece un diagrama de la secuencia de hechos 
que da lugar al condicionamiento de orden superior. 

Como el término «condicionamiento de orden superior» indica, se puede con- 
siderar que el condicionamiento opera a diferentes niveles. En el ejemplo ante- 
rior, el condicionamiento del tono con la comida se considera condicionamiento 
de primer orden. El condicionamiento de la luz con el tono previamente condi- 
cionado se considera condicionamiento de segundo orden. Si la luz condicionada 
se usara después para condicionar todavía un estímulo nmíás (un olor, por ejemplo) 
se consideraría condicionamiento de tercer orden. Aunque no hay duda de que el 


condicionamiento de segundo orden es un fenómeno sólido (Rescorla, 1980a), se 
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han realizado pocas investigaciones para evaluar los mecanismos del condiciona- 
miento de tercer orden y de órdenes superiores. Sin embargo, la sola existencia 
del condicionamiento de segundo orden es muy significativa porque aumenta 
enormemente la variedad de situaciones en las que el condicionamiento clásico 
puede tener lugar. Con el condicionamiento de orden superior se puede obtener 
condicionamiento clásico sin un estímulo incondicionado primario. El. único 
requisito es que se disponga de un estímulo previamente condicionado. 


El contracondicionamiento.. Muchos casos de aprendizaje por asociación, 
incluyendo el condicionamiento de orden superior, cumplen el criterio de la 
fuerza biológica diferencial. Sin embargo, este criterio no se cumple en todas las 
situaciones que facilitan el aprendizaje por asociación entre estímulos. Dos-estí, 
mulos pueden asociarse entre sí aun cuando inicialmente los dos provoquen res: 
puestas intensas o tengan una fuerza biológica considerable. Una situación en la: 
que puede ocurrir esto se denomina contracondicionamiento. En el contracondi-' 
cionamiento, la respuesta que da un animal a un estímulo se Invierte o «se.con-' 
trarresta» asociando este estímulo- eon..un. segundo que provoca las reacciones 
Contrarias, Por. ejemplo, existiría contracondicionamiento si a un animal se le 
entrenara para acercarse a un estímulo que inicialmente suscita una respuesta de 
alejamiento. Algunos experimentos de contracomdicionamiénto han utilizado 
parejas de estímulos que normalmente se consideran incondicionadosí El condi- 
cionamiento de aversión sexual a menudo es de este tipo. Si a una rata'macho se 
le presenta una rata hembra receptiva y entonces se le suministra una descarga 
eléctrica, puede aprender una aversión a la hembra. Aunque se aprende una nueva 
respuesta a la hembra, es difícil argumentar que este aprendizaje se produce por- 
que la fuerza biológica de la descarga es mayor que la fuerza biológica de la rata 
hembra. Los dos estímulos provocan inicialmente respuestas incondicionadas muy 
intensas. Además, las respuestas elicitadas son muy diferentes (buscar, oler y 
montar, en el caso del estímulo de la rata hembra, y sobresaltarse, saltar y posi- 
blemente agredir, en el caso del estímulo de la descarga). Por tanto, es imposible 
decidir sí las respuestas iniciales a la rata hembra son más fuertes (o más débiles) 
que las respuestas a la descarga eléctrica. 


El precondscionamiento sensorial. El contracondicionamiento implica el 
aprendizaje de una asociación entre dos estímulos, cada uno de los cuales provoca 
una respuesta intensa antes del condicionamiento. Se pueden también aprender 
asociaciones entre dos estímulos cada uno de los cuales provoca sólo una suave 
_ respuesta de orientación antes del condicionamiento. Una de las situaciones en las 
que se investiga frecuentemente esta modalidad de aprendizaje es el precondi.. 
cionamiento sensorial.-La figura 4,4 muestra el procedimiento del precondicio- 
namiento sensorial. Los animales reciben primero exposiciones repetidas de dos 
estímulos biológicamente débiles que se presentan juntos. Los estímulos pueden 
ser dos claves visuales, por ejemplo, .un..triángulo que se presenta cerca dé un 
“cuadrado. En esta fase del entrenamientó 'no existen pruebas-de cóndicionamiento-- 
“de la respuesta Niel rriáigulo. nieFcnadeedo-prow nuevas respuestas, El 
"condicionsmiéñita. : tiene Jugar.en.una.seguada.f lel-experi-..... 


mento, en el que un triángulo se empareja con un estímulo. incondicienado, como 


la comida. "Cómo resultado del condicionamiento con comida se condiciona al 
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Fase 1 Fase 2 Xt. Prueba Figura 4.4. —Procedimiento para 
San LE el precondicionamiento sensorial 


EC2 ——=»- ECl ECl ——-- Er EC Y Primero se empareja EC2 con 
N 3 eS EC1 sin introducir ua estímulo 
ad N s 


de e a 58 incondicionado en la situación. 
de A » Después se empareja este ECl 


A 
a ROO A RE con un El, por lo que se provoca 
o la presentación de una reSpuesta 
condicionada. En una sesión posterior se encontró que EC2 también elicita la respuesta condicionada, a 
pesar de que EC2 nunca fue emparejado con el El 


triángulo una respuesta de acercamiento. El hallazgo significativo es que una vez 
que el triángulo provoca un seguimiento del signo, el cuadrado también provoca 
esta respuesta por $u asociación previa con el triángulo, “Así pues, lá "asociación 
entre las dos claves audiovisuales inocuas se hace evidente cuando uno de los 


estímulos se condivióna para provocar una respuesta intensa. 


La fuerza biológica diferencial como ayuda para medir el aprendizaje más que 
para producirlo. : El ejemplo del precondicionamiento sensorial sugiere que la 
fuerza biológica diferencial puede ser importante en los casos de aprendizaje por 
asociación porque permite observar más fácilmente los efectos del aprendizaje, no 
porque facilite realmente el proceso de aprendizaje. El fenómeno del precondi- 
cionamiento sensorial indica que los organismos son totalmente capaces de 
aprender a asociar dos estímulos inocuos, ECly EC2, entre sí. Sin embargo, este 
aprendizaje no resulta directamente patente. La asociación no se refleja en la 
conducta hasta que se logra que el estímulo (EC1) provoque una respuesta intensa 
(hasta que, según terminología de Pavlov, uno de los estímulos se hace biológi- 
camente fuerte). La asociación se puede observar entonces a través de una res- 
puesta análoga provocada por un segundo estímulo (EC2). 

El método de alguna forma indirecto, que se utiliza para dar expresión con- 
ductual a la asociación aprendida en el procedimiento de precondicionamiento 
sensorial, no es necesario en otros procedimientos que hemos considerado antes, 
porque en esos otros procedimientos las claves se asocian con estímulos que ya 
provocan respuestas intensas. En el condicionamiento estándar de primer orden 
(el condicionamiento salivar, por ejemplo), un estímulo inocuo (EC) se asocia Con 
un acontecimiento biológicamente fuerte (El); en virtud de esta asociación, el EC 
provoca una respuesta propia del El. El condicionamiento de orden superior es 
similar en el sentido de que un estímulo inicialmente «neutro» se asocta con uno 
que provoca respuestas más fuertes. En el contracondicionamiento, el estímulo 


asociado es asimismo biológicamente fuerte, de forma que las asociaciones con él 


dan como resultado un apreciable cambio en la conducta elicitada. 


Las diferencias en los mecanismos de aprendizaje en relación con la fuerza 
biológica. La discusión anterior indica que la fuerza biológica de los estímulos 
que forman parte de la asociación es importante para obtener pruebas de que se 
ha producido aprendizaje: para dar expresión conductual a una asociación apren- 
dida. ¿Es también importante la fuerza biológica de los estímulos para la nAatura- 
leza del aprendizaje que tiene lugar? Ésta es una cuestión que muchos investiga- 
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dores no han considerado. Sin embargo, las pruebas de que disponemos ac- 
tualmente sugieren que la respuesta es afirmativa. Las asociaciones entre dos 
estímulos biológicamente débiles (dos claves visuales, por ejemplo) parecen 
aprenderse de forma algo diferente a las asociaciones entre un estímulo débil y 
uno fuerte (un sonido y comida, por ejemplo). Ya advertimós eri el capítulo 3 que 
en los procedimientos habituales de condicionamiento pavloviano la presentación 
simultánea del EC y el El no es tan eficaz para producir aprendizaje como la 
presentación del El inmediatamente después del EC. Ocurre en cambio lo contra- 
rio si la asociación se está formando entre dos estímulos biológicamente débiles, 
como en el procedimiento de precondicionamiento sensorial: En este caso, el con- 
dicionamiento simultáneo es más eficaz que las presentaciones sucesivas de los 
estímulos que se van a asociar. (Para otras diferencias entre el condicionamiento 
clásico convencional y el aprendizaje de asociaciones entre dos estímulos biológi- 
camente débiles, véase Rescorla y Durlach, 1981.) En las futuras investigaciones 
se va a tener que definir con más precisión las circunstancias en las que se deben 
aplicar esas reglas «especiales» de aprendizaje. 


¿QUE DETERMINA LA NATURALEZA DE LA RESPUESTA 
CONDICIONADA? 


En éste y anteriores capitulos hemos presentado numerosos ejemplos de con- 
dicionmamiento clásico. En toda la discusión, el condicionamiento se identificaba 


por el desarrollo de respuestas nuevas a los estímulos condicionados. Hemos des- 





APARTADO 4.2. El contracondicionamiento y el dolor de parto 


Muchos padres que están esperando un niño reciben hoy día entrenamiento para 
afrontar las molestias del parto sin tener que urilizar anestesía. Un médico francés, el 
doctor Lamaze, desarrolló una popular técnica después de observar la práctica de los tocó- 
logos rusos. El método de Lazasne, que es como se le llama, había sido desarrollado por 
médicos rusos como aplicación del contracondicionamiento. El nacimiento de un niño trae 
consigo una serie de contracciones uterinas que van aumentando hasta que nace el bebé. 
Durante el parto, las mujeres suelen asustarse, ponerse tensas y alarmarsé como respuesta 
a las molestias cada vez mayores. La tensión provocada por las contracciones sólo empeora 
la situación, pues aumenta las molestias. La técnica de entrenamiento de Lamaze trata de 
contracondicionar las sensaciones de la contracción de forma que susciten una respuesta 
nueva que sea incompatible con la tensión. En primer lugar se le enseña a la mujer a 
relajarse. Después aprende un conjunto de pautas de respiración que tiene que poner en 
práctica cuando aparezca cada contracción. Estas pautas de respiración requieren mucha 
concentración, y, por tanto, distraen a la mujer de las molestias e inhiben la tensión. Asi 
pues, las contracciones del parto, en vez de provocar tensión desencadenan unas pautas 
complicadas de respiración. 

Aunque la técnica de Lamaze se basaba originariamente en el concepto de contracondi- 
cionamiento, no está totalmente claro que el mecanismo responsable de la reducción del 
dolor sea el del contracondicionamiento. La técnica difiere de los procedimientos estándar 
de laboratorio en que el entrenamiento se realiza con contracciones falsas casi en su totali- 
dad. Se realiza poco condicionamiento con contracciones reales. Sin embargo, sea o no el 
entrenamiento de Lamaze un ejemplo válido de contracondicionamiento, ilustra cómo los 
principios de laboratorio pueden llevar a aplicaciones provechosas. Hoy en día, muchas 
mujeres dan a luz a sus bebés con menos molestías que antes, y se evitan los analgésicos 
que pueden ser perjudiciales para el niño, 
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Ny 
la conexión innata entre los centros del El y de la RQ Por tanto, el condiciona- 
miento capacita al estímulo condicionado para provocar la respuesta condicio- 
nada. La respuesta al estímulo condicionado puede no ser siempre idéntica a la 
respuesta al estímulo. incondicionado. Pueden darse diferencias entre las dos 
cuando, por ejemplo, el estímulo condicionado no es tan intenso como el estímulo 
incondicionado y produce en consecuencia menor excitación en el centro de la RI. 
Sin embargo, el modelo pavloviano predice que en términos generales la natura- 
leza y la forma de la respuesta condicionada serán similares a las de la respuesta 
condicionada, A causa de la nueva vía funcional establecida entre el centro del EC 
y el centro del El, los efectos que, produce el estímulo condicionado en el sistema 
nervioso son efectos similares a los del estímulo incondicionado, En un sentido, el. 


- EC se convierte en un sustituto del El Esta es la razón de que al modelo se le. 
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crito una gran variedad de respuestas que pueden condicionarse, entre las que se 
incluyen la salivación, el parpadeo, el miedo, el acercamiento y alejamiento loco- 
motor y respuestas aversivas, así como procesos fisiológicos que intervienen en la 
digestión, la sensibilidad al dolor y la defensa inmunológica. Sin embargo, todavía 
no hemos considerado explicitamente por qué un conjunto de respuestas se con- 
dicionan en una situación y Otras respuestas se condicionan en otras circunstan- 
cias.: ¿Qué factores determinan las respuestas que se adquieren en el transcurso 
¡del condicionamiento Cd Se han sugerido varias respuestas a esta pregunta. 
Vamos a describir alguno de los modelos importantes y a discutir qué pruebas los 
apoyan o contradicen. 


«ma A O a 


Name” modelo de sustitución del estímulo: 


A A a a 


El modelo de sustitución del estímulo 


El El como factor determinante de la RC. El modelo de la sustitución del 
estímulo sosriene que cada estímulo incondicionado tiene su propio y único centro 
cerebral, que está conectado con un único centro para la respuegta condicionada. ' 

El modelo predice que si el condicionamiento convierte el EC 6 sustituto del 

El, los estímulos condicionados a diferentes estímulos incondicionados provoca- 
rán tipos diferentes de respuesta condicionada. Esto es cierto, obviamente. Los 
animales aprenden a salivar cuando se les condiciona con comida y a pestañear ¿, 
cuando se les condiciona con un soplo de aire en el ojo. La salivación no se + 
condiciona en los experimentos de condicionamiento del parpadeo, y las respues- 
tas de parpadeo no se condicionan en los experimentos de condicionamiento 
salivar. 

La comparación anterior del condicionamiento salivar y de parpadeo demues- 
tra que diferentes estímulos incondicionados conducen a respuestas condicionadas 
diferentes. El modelo de sustitución del estímulo también predice que la forma de 
la respuesta condicionada será similar a la forma de la respuesta incondicionada. 
En algunas situaciones también se confirma esta predicción. Considérese, por 
ejemplo, el condicionamiento con agua y comida en las palomas. La comida y el 
agua son estímulos reforzantes que se ingieren. Sin embargo, la respuesta incon- 
dicionada de las palomas (y de otros muchos animales) a esos dos estímulos es 
muy diferente. La paloma que come grano realiza movimientos de picoteo rápidos 
E y bruscos dirigidos al grano, abriendo ligeramente el pico en el momento del 
contacto. Por el contrario, para beber mete su pico en el agua, absorbiendo un 
poco, y después levanta la cabeza para dejar que el agua descienda lentamente por 
la garganta. Así pues, las respuestas incondicionadas de comer y beber difieren 
tanto en la forma como en la velocidad. | AAA 

Jenkins y Moore (1973) compararon el seguimiento del signo en las palomas 


La idea más antigua acerca de lo que los animales aprenden en el condiciona- 
miento clásico está basada en un modelo de condicionamiento propuesto por Pav- 
lov. Como ya se indicó en el capítulo 3, Pavlov era ante todo fisiólogo. No era de 
extrañar, por tanto, que su modelo de condicionamiento tuviera una orientación 
decididamente fisiológica. Teóricamente, Pavlov consideraba que el cerebro estaba 
formado por centros neurológicos separados (véase “figura 1.5). Sugirió que un 

“centro cerebral, era el responsable principal del procesamiento del estímulo 

iñcóndicionado, y un centro diferente. el responsable principal de procesar el 
estimulo condicionado. Se suponía que. un tercer centro cerebral era.el responsa- 
blé de generar. la respuesta condicionada. Como la respuesta incondicionada se 
daba siempre que se presentaba el estímulo incondicionado, Pavlov supuso que 
había una conexión neurológica entre el centro neurológico del El y el centro 
neurológico de la RÍ (véase figura 4.5). Además, puesto que la reacción al El no 
era aprendida, supuso que la vía funcional entre los centros del El y la RI era 
innata (véase figura 4.5). 

Dé. acuerdo con el modelo de Pavlov, el aprendizaje de las respuestas condi- 
ciofíadas se produce a través del establecimiento de nuevas vías neurológicas fun- 


cionales. En el transcurso del emparejamiento repetido de los estímulos condicio- 
níádo € incondicionado, se desarrolla una conexión entre el centro cerebral del EC 
y el centro cerebral del El. A través de esta nueva vía neurológica la presentación 
del estímulo condicionado produce una excitación del centro neurológico del El. 
La excitación del centro del El genera a su vez la respuesta condicionada gracias a 





Centro Centro Figura 4.5.—Diagrama del mo- A 
de EC de El delo de Pavlov de sustitución del con comida y con agua como estímulos incondicionados. En ambas situaciones 
a Me K estímulo. La flecha continua in- experimentales, el estímulo condicionado fue la iluminación de un pequeño disco 
AER AA dica una conexión neural innata. o tecla de respuesta durante los 8 segundos anteriores a la presentación del estímu- 


o La flecha discontinua indica una 
conexión neural aprendida. El 
EC llega a provocar una respues- 
ta mediante la activación del cen- 
tro de El, que elicira la respuesta 

Centro de forma innata. 


lo incondicionado. Tras repetidos emparejamientos de la luz y el grano, las palo- 
mas comenzaban a picotear de forma gradual la tecla iluminada. El picoteo tam- 
bién se generaba con emparejamientos repetidos de la tecla luminosa y el agua, 
Sin embargo, la forma de la respuesta condicionada era muy diferente en cada una 
de las situaciones. En el experimento con comida, las palomas picoteaban la tecla 


de respuesta 
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de respuesta como si comieran: los picoteos eran rápidos, con el pico ligeramente 
abierto en el momento del contacto. En el experimento del agua, el movimiento 
de picoteo era más lento, se hacia con el pico cerrado, y a menudo iba acompa- 
fiado de movimientos de deglución. Así pues, la forma de la respuesta condicio- 
nada venía determinada por la forma de la respuesta incondicionada y se parecía a 
ella, Los picoteos parecidos a los del comer ocurrían en el condicionamiento con 
comida, y los picoteos parecidos a los del beber se daban en el condicionamiento 
con agua. Estos hallazgos proporcionan un apoyo al modelo de la sustitución del 
estímulo, (Véase ejemplos adicionales de respuestas condicionadas determinadas 
por la naturaleza del El en Davey y Cleland, 1982; Davey, Cleland, Oakley y 
Jacobs, 1984; Pelchat, Grill, Rozin y Jacobs, 1983; Peterson, Ackil, Frommer y 
Hearst, 1972.) 


Dificultades con el modelo de sustitución del estímulo. En las investigacio- 
nes americanas sobre condicionamiento clásico surgieron dudas, muy pronto, 
acerca del modelo de sustitución del estímulo. El problema consistía en que en 
muchas situaciones la forma de la respuesta condicionada y la de la incondicio- 
nada eran significativamente diferentes. Hilgard recogió varios casos hace mu- 
chos años (Hilgard, 1936). Observó, por ejemplo, que mientras la respuesta 
incondicionada.a la descarga eléctrica consiste en un aumento en el ritmo de la 
respiración, la respuesta condicionada a un EC emparejado con la descarga es un 
descenso del ritmo de la respiración. Un estudio detallado de la forma de las 
respuestas condicionadas de parpadeo mostró también que los humanos parpa- 
dean de forma diferente al responder a estímulos condicionados e incondiciona- 
dos. En otra investigación de este tipo, pero con perros, Zener (1937) observó 
con atención las respuestas motoras y de salivación ante uma campana que se 
habí jado con la comida. La respuesta incondicionada a la comida siempre 
consistía en bajar la cabeza hacia el plato de la comida y masticar un trozo o más 
de comida. Después del condicionamiento, la campana rara vez provocaba movi- 
mientos de masticación, y si éstos aparecian, no duraban. La respuesta condicio- 
nada a la campana sólo a veces incluía la respuesta de orientación hacia el plato. 
En algunos ensayos, el perro, en higar de hacer eso, miraba la campana. En otros 
ensayos, la orientación del perro vacilaba entre el plato de comida y la campana, y 
en. otras ocasiones, cuando sonaba la campana, el perro mantenía la cabeza entre 
el plato de comida y la campana. Así pues, las respuestas condicionadas provoca- 
das por la campana eran a menudo distintas de las respuestas incondicionadas 
provocadas por la comida. 


Enfoques modernos de la sustitución del estímulo. Algunos investigadores 
contemplan con escepticismo el modelo de sustitución del estímulo debido a que 
la forma de la respuesta condicronada no es invariablemente similar a la forma de 
la respuesta incondicionada. Los teóricos modernos creen, asimismo, que los 
mecanismos neurológicos del aprendizaje son mucho más complejos de lo que 
implica el modelo de sustitución del estímulo. Pese a todo, el estímulo incondicio- 
nado parece ser muy importante para determinar otras características de la res- 
puesta condicionada que no sean las de su forma. Las manipulaciones que influyen 
de modo directo en la respuesta incondicionada afectan también a la respuesta 
condicionada. Algunos teóricos modernos han propuesto en consecuencia una 
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variante del modelo de la sustitución del estímulo. Este modelo conserva la idea 
de que la respuesta condicionada se suscita por medio de un «centro» de algún 
tipo. Sin embargo, en un esfuerzo por evitar implicaciones engañosas sobre los 
mecanismos neurológicos, los enfoques contemporáneos no hacen referencia al 
sistema nervioso. Ántes al contrario, se formulan en términos más abstractos. El 
nuevo modélo establece que los. animales aprenden dos cosas del emparejamiento 
repetido de un EC y un El..En primer lugar, aprenden una asociación entre el EC 
y el EL En segundo lugar, formán una imagen,.o. representación, del estímulo 
incondicionado. Según este modelo, la respuesta condicionada depende de estos 
dos factores. El EC provoca la RC por su asociación con la representación del El. 
Si la asociación EC -RC o la representación del El es débil, la respuesta condicio- 
nada no se producirá./ 

Pruebas fehacientes de la importancia de la representación del El en el condi- 


cionamiento clásico se obtienen en aquellos experimentos en los que la represen- 


tación del El se manipula sin cambiar la asociación EC - El Algunos de estos 
estudios consistían en reducir el valor de la representación del El después del 
condicionamiento. En Tofiguea4.6 se ilustran la estrategia y los principios racio- 
nales que intervienen en uno de estos experimentos (Rescorla, 1979). En la fase 
primera del experimento, el grupo experimental y el grupo de control recibieron 
el entrenamiento convencional de supresión condicionada, con un ruido fuerte 
como estímulo incondicionado. Se supone que en esta fase del experimento se 
establecía una asociación entre el EC y el El en los dos grupos, y que se lograba 
que los sujetos se formaran una representación del El del ruido fuerte. En la fase 
siguiente del experimento, el grupo experimental recibió un tratamiento que 


Fase 1 | Fase 2 Prueba 
O Po, 
Grupo Ec) — (EX) En) se vuelve El) —a LEN 
experimental Ñ N 
SS 
e. 0-0 0*O O-O 
de control N N 


Figura 4.6, —Estrategia básica y explicación razonada de los experimentos de devaluación del El. En la 
fase 1 el grupo de control y el experimental reciben un condicionamiento convencional para que se 
establezca la asociación encre EC y El, y para que los sujecos se formen una representación del El. En 
la fase 2 se devalúa la representación del El de los sujeros del grupo experimental. La representación 
del El en los sujetos del grupo de control permanece inalterada. Si la respuesta condicionada (KC) es 
provocada por medio de la representación del El, sería de esperar que, debido a la devaluación de la 
representación del El del grupo experimental, se reduzca en éste la respuesta ante el EC. 
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tenía por objeto devaluar la representación del El. El ruido fuerte fue presentado 
repetidamente para reducir (habituar) la respuesta de los sujetos a ese El. El 
grupo de control no estaba expuesto al ruido durante esta fase. Se suponía, por 
tanto, que la representación del El permanecía intacta en el grupo de control 
(véase figura 4.6). Los efectos de la devaluación de la representación del El se 
midieron realizando pruebas en las que se presentaba a los sujetos el estímulo 
condicionado. El grupo experimental mostró una supresión de las respuestas 
durante la presentación del EC significativamente menor que el grupo de control. 
Así pues, el tratamiento de devaluación del El redujo el poder del EC para provo- 
car la respuesta de supresión condicionada. Este experimento muestra de una 
manera ingeniosa que la respuesta condicionada es elicitada a través de la repre- 
sentación de un El. 

Los efectos de la devaluación del El sobre la elicitación de la respuesta condi- 
cionada se han investigado también en el condicionamiento clásico con comida. 
Sin embargo, como los animales no se habitúan a la comida de la misma forma 
que a los ruidos intensos, ha' habido que usar otras técnicas para devaluar la 
representación del El. Se han probado dos experimentos con este fin. Uno consis- 
tía en saciar a los animales con comida. El otro consistía en condicionar una 
aversión a la comida emparejando la comida con un malestar inducido, haciendo 
que la plataforma diera vueltas rápidas o inyectándole al animal alguna droga. 
Tanto “el procedimiento de saciedad como el de aversión a la comida reducían la 
capacidad del estímulo condicionado con la comida para provocar la respuesta 
condicionada (Cleland y Davey, 1982; Holland y Rescorla, 1975a; Holland y 
Straub, 1979). 

Los experimentos anteriores, junto con otras investigaciones (por ejemplo, 
Bouton, 1984; Rescorla, 1974; Rescorla y Cunningham, 1977; Rescorla y Heth, 
1975), muestran que el estatus de la representación del El puede ser muy impor- 
tante en el condicionamiento clásico. En las situaciones descritas arriba, los suje- 
tos aprendían una asociación entre el EC y una representación del El, y la res- 
puesta condicionada se marerializaba a través de la representación del El. 


Aprendizaje E-E frente a aprendizaje E-R. En los ejemplos anteriores, el 
hecho de que un estímulo condicionado provocara o no la RC dependía esencial- 
mente del estatus de la representación del El. El condicionamiento clásico no daba 
como resultado la formación de una nueva conexión refleja entre el EC y la RC 
que hiciera que se elicitara la RC en cuanto se presentaba el EC. Lo que sucedía, 
más bien, era que el condicionamiento en esos casos daba lugar a una asociación 
entre el EC y una representación del El. La presentación del EC activaba la repre- 
sentación del El, y la RC era simplemente un reflejo de esta representación del 
El. A este tipo de resultado se le llama aprendizaje estímulo-estímulo, o aprendi- 


zaje E-E. En el aprendizaje E-E los sujetos aprenden una asociación entre dos. . 


estímules- (el EC -y- el -El, por.ejemplo), y la respuesta condicionada“és sólo un 
reflejo indirecto de esta asociación estímulo-estímulo. La aparición de la respuesta 
condicionada depende del impacto conductual del estímulo asociado (el El) en ese 
momento. Si se reduce el impacto sobre la conducta del estímulo asociado (por 
medio de la habiruación, por ejemplo), la respuesta condicionada resultante tam- 
bién sería reducida. 


Los ejemplos de devaluación del El descritos arriba nos proporcionan pruebas 








———_ rm 
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del aprendizaje E-E. Previamente habíamos hallado pruebas del aprendizaje A 
en una situación diferente de condicionamiento, el precondicionamiento sensoria 
(véase figura 4.4). En el precondicionamiento sensorial, los- sujetos a 
primero una asociación entre dos estímulos inocuos, EC2 y EC1. Que el C 

suscite una respuesta condicionada observable como resultado de esta asociación 


' depende del impacto sobre la conducta del estímulo asociado, EC1. Si aumenta el 


impacto conductual del estímulo asociado (al emparejar el EC1 con un El biológ!- 
camente fuerte), aparece una respuesta condicionada al EC2. En los a 
de precondicionamiento sensorial se aumenta el impacto conductual del estím , 
asociado. En los experimentos de devualuación del El se hace disminuir € 
impacto sobre la conducta del estímulo asociado. Ambos tipos de oir 
ilustran el aprendizaje E-E porque en ambos casos la respuesta eo O a se 
desencadena gracias al impacto sobre la conducta del estímulo asociado. duda 
Aunque existen pruebas de aprendizaje E-E, extraídas de una gran varieda e 
situaciones experimentales, no todos los casos de condicionamiento clásico impli- 


* can un aprendizaje E-E. Parece. que en algunos, casos los sujetos aprenden una 


asociación directa entre: el-EE-y-fa-RC. Esta clase.de aprendizaje se llama a 
“zaje estímulo-respuesta,. o. aprendizaje E-R. Los estudios. de condicionamiento de 
segundo orden aportan pruebas del aprendizaje. E-R... 

Aprendizaje E-E frente a aprendizaje E-R en el condicionamiento de a 
orden. ¿Cómo podemos saber si en el condicionamiento de segundo orden Ae 
aprenden asociaciones E-E o E-R* Recordemos que en el o A 
segundo orden, el aprendizaje se produce porque un estímulo nuevo ES al 
orden, el EC2, se empareja con un estímulo previamente condiciona o, € , 
(véase figura 4.3). La relación entre el EC2 y el EC1 en el condicionamiento Le 
segundo orden es comparable, desde el punto de vista del procedimiento, a 
relación del EC1 con el El en el condicionamiento de primer orden. Si el condi- 
cionamienta de segundo orden implicara un aprendizaje E-E, el EC2 RS una 
respuesta condicionada a través de la representación del EC1. En la parte 
izquierda de la figura 4.7 se ilustra esta posibilidad. Si el EC2 elicitara una a 
puesta condicionada a través de la representación asociada del EC], entonces a 
cambiar el impacto conductual del EC1 debería cambiar también la respuesta 0d 
vocada por el EC2. El impacto sobre la conducta del EC1 puede alterarse ser e- 
mente extinguiendo el EC1. Según la interpretación en terminos pe o 
E-E, la extinción del EC1, después del aprendizaje de segundo orden, debería 
también debilitar la respuesta del sujeto al EC2. A 

Si el condicionamiento de segundo orden supusiera un aprendizaje E-R, E 
EC2 provocaría directamente la respuesta condicionada. En la parte EEE de E 
figura 4.7 se ilustra esta posibilidad. Si el EC2 llegara a provocar la respues a 
condicionada directamente, a través de una asociación E-R, entonces, una vez que 
se hubiera establecido esa asociación, los cambios en el impacto sobre la conducta 
del EC1 no deberían tener ningún efecto sobre la respuesta al EC2. Así pues, 0 
acuerdo con la interpretación en términos de aprendizaje E-R, la E de 
EC1 después del condicionamiento de segundo orden no debería debilitar la res- 

jeto al EC2. o 
ee los acerca del efecto de la extinción del EC1 tras el condicionamiento 
de segundo orden han arrojado resultados muy diversos. En algunas situaciones, 
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Aprendizaje E-E Aprendizaje E-R Figura 4.7.—Dos posibles meca- 
nismos del condicionamiento de 
segundo orden. En el aprendi- 
zaje E-E, la respuesta condicio- 
nada es provocada por medio de 
la representación del EC1. En el 
aprendizaje E-R, la respuesta 


condicionada es provocada direc- 
—» tamente por EC2, 


el condicionamiento de segundo orden parecia implicar un aprendizaje E-R 
(Archer y Sjoden, 1982; Holland y Rescorla, 1975a, 1975b; Rizley y Rescorla, 
1972). En otros casos, los datos indican que el condicionamiento de segundo 
orden implica un aprendizaje E-E (Hittesdorf y Richards, 1982; Leyland, 1977, 
Rashotte, Griffin y Sisk, 1977; Rescorla, 1979). Sólo ahora empezamos a com- 
prender mejor las condiciones en las que un tipo de aprendizaje predomina sobre 
el otro (por ejemplo, Nairne y Rescorla, 1981; Rescorla, 1982). Las investigacio- 
nes futuras en torno a esta cuestión van a revelar hechos fundamentales sobre los 
procesos de aprendizaje. 


El modelo de la respuesta compensatoria 


Como hemos visto, la idea de Pavlov de que el condicionamiento implica 
sustitución del estímulo, no ha demostrado su validez a la luz de las modernas 
investigaciones. El EC no se convierte en sustituto del El en el sentido de que 
provoque una respuesta como la respuesta incondicionada. En lo que más se acer- 
can las concepciones modernas del condicionamiento clásico al modelo de sustitu- 
ción del estímulo es en la idea de que el EC activa una representación del El, y 
que la respuesta condicionada es un reflejo indirecto de esta representación del El. 
Sin embargo, este punto de vista sobre la representación del El no especifica la 


forma que tomará la respuesta condicionada. Se han propuesto otras explicaciones _ 


de la naturaleza de. las-tespuestas- condicionadas, Una de las más radicales, el 


modelo de la respuesta compensatoria; se basa en vn-gran número de investiga- 


ciones que emplearon drogas como -estímulo .incondicionado.. 

En muchas situaciones de condicionamiento clásico en las que se emplean 
drogas como estímulo incondicionado, la forma de la respuesra condicionada es la, 
opuesta a la de la respuesta incondicionada. Por ejemplo, la epinefrina origina 
como respuesta incondicionada una disminución de la secreción gástrica. Por el 


contrario, la respuesta a un EC a la epinefrina consiste en un aumento de la| 
secreción gástrica (Guha, Dutta y Pradhan, 1974). El dinitrofenol causa un] 


aumento en el consumo de oxígeno y un aumento de temperatura. La respuesta a 
un EC al dinitrofenol EC supone un descenso en el consumo de oxígeno y un 
descenso de la temperatura (Obál, 1966). Estos ejemplos y otros similares (véase 
Siegel, 1977b) han aumentado el interés por el modelo de la respuesta compensa- 
toria. El modelo se ha discutido sobre todo en referencia a situaciones de condi- 
cionamiento con drogas. Según el modelo, debe esperarse que las respuestas con- 
dicionadas a estímulos incondicionados como las drogas sean compensatorias de 
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las respuestas incondicionadas provocadas por la droga. De esta forma, si la droga 
origina un cambio de conducta en una dirección, el modelo predice que los ECs a 
la droga producirán. cambios de conducta en la dirección contraria. 

El modelo de la respuesta compensatoria ha atraído mucho la atención porque 
sirvió de base para una explicación innovadora del desarrollo de la tolerancia a las 
drogas. Se dice que se ha desarrollado una tolerancia a una droga cuando las 
administraciones repetidas de la droga producen cada vez menos efecto. Cuando 
se consumen drogas, el desarrollo de la tolerancia a la droga es con frecuencia un 
problema serío porque progresivamente se requieren dosis mayores de droga para 
que surtan un efecto determinado. Tradicionalmente se ha considerado que la 
tolerancia a la droga es el resultado de procesos farmacológicos. En contraposi- 
ción a este enfoque tradicional, Shepard Siegel ha propuesto un modelo de tole- 
rancia a la droga basado en el condicionamiento clásico (véase una revisión 
reciente en Siegel, 1983). El modelo sostiene que, con las presentaciones repetidas 
de una droga, los estímulos que siempre acompañan a la administración de la 
droga se convierten en estímulos condicionados a la droga. Estos estímulos 
podrían ser la hora del día, las sensaciones que intervienen en la preparación de 
la jeringuilla o los estímulos derivados del hecho de sacar un comprimido para 
ingerirlo, Se supone que las claves condicionadas a la administración de la droga 
provocan respuestas condicionadas que son opuestas a las reacciones incondicio- 
nadas a la droga. Dado que las respuestas condicionadas compensan los efectos de 
la droga como tal, esas respuestas reducen la reacción que normalmente provoca 
la droga. Por tanto, la respuesta a la droga se atenúa cuando ésta se toma en 
presencia de tales estímulos condicionados (véase figura. 4.8). 

El modelo de tolerancia a la droga basado en el condicionamiento atribuye la 
tolerancia a las respuestas compensatorias condicionadas a los estímulos ambien- 
tales emparejados con la administración de la droga. Si el modelo es correcto, las 
manipulaciones del medio externo deberían influir en la eficacia de la droga. 
Varios aspectos de esta predicción han sido confirmados por Siegel y sus colabo- 
radores en experimentos con opiáceos, como la morfina y la heroína (Siegel, 
1975b, 1976, 1977a, 1978; Siegel, Hinson y Krank, 1978). La morfina tiene un 


(A) Figura $.8.—Diagrama del mo: 
e delo de condicionamiento pavlo- 
viano de tolerancia a las drogas. 


La fuerza de la reacción a la 

droga viene representada por 

(B) desviaciones respecto a la hori- 
A _ AT zontal. (A) Reacción al EC más 

la droga antes del condiciona- 
muento, que ilustra la respuesta 
incondicionada a la droga. (B) 
Reacción atenuada al EC más la 
droga después de una larga ex- 
periencia con la droga, que ¡lus- 
tra la tolerancia a la droga. (C) 
Componentes de la reacción tras 
- Respuesta el condicionamiento, que mues- 
neta observada Respuesta incondicionada a la droga traga que la respuesta atenuada 


neta a la droga se debe a que la 
respuesta condicionada compensatoria al EC contrarresta la respuesta incondicionada a la droga. 


Respuesta compensatoria 
condicionada al EC 


E 
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sa A EE El modelo de respuesta compensatoria condicionada sobre la tolerancia a la 

istori ¿di és ¡ ¡ : droga ha proporcionado una perspectiva nueva e Importante sobre los MeEcanis- 
largo historial médico como analgésico. Sin embargo, los pacientes desarrollan 5 d llo de la tolerancia, y muestra el poder del condicionamiento clá- 
rápidamente tolerancia a ella, de forma que una determinada cantidad de droga  : mos de pe Ei da a e e drogas. Sin embargo, no ha dado una expli- 
resulta cada vez menos eficaz para reducir el dolor. Los efectos analgésicos de la; a pe Loa pe pea satisfactoria acerca de la forma de las respuestas 
droga pueden restablecerse si se retiran las claves usualmente asociadas a la i a A condicionadas. El problema es que mo todas las respuestas condicio- 
administración de la droga, administrando la droga con un procedimiento nuevo o nadas son opuestas a los efectos manifiestos del estímulo incondicionado. Por 
en otra habitación. Es también menos probable que se produzca la tolerancia a la ejemplo, la anfetamina origina un aumento de la actividad como respuesta incon- 
droga si antes de recibir la droga los sujetos están muy familiarizados cof los dicionada, y esta conducta puede condicionarse a los estímulos que precedan habi- 
estímulos asociados a la administración de la droga, porque esa familiaridad con tual mente a la presencia de anfetamina (Pickens y Dougherty, 1971). La insulina 
los estímulos condicionados interfiere con el condicionamiento. Finalmente, la produce un descenso de lo acrididad: convulsiones y falra de respuesta a la esrimu- 
tolerancia a la droga puede invertirse extinguiendo las claves asociadas a la admi- lación que se aplica; esta pauta de comportamiento también aparece aos 
nistración de la droga mediante la presentación repetida de esas claves sin la puesta a un EC condicionado a insulina (Siegel, 1975a). Hay más casos en q 
droga. (Véase otras investigaciones recientes sobre el modelo de tolerancia a la 


medición de sistemas de respuesta múltiple indica que algunas uo o 
) | | 1 imi 1 ici n opuestas. Por ejem 
droga, por ejemplo, en Crowell, Hinson y Siegel, 1981; Dafters, Hetherington y cionadas son similares a las incondicionadas y Otras son Op jemplo, 





Y 


7 


McCartney, 1983; Poulos y Hinson, 1982; Shapiro, Dudek y Rosellini, 1983; Tif- 


fany y Baker, 1981). 





APARTADO 4.3. Sobredosis de beroína por la falta de estímulos condicionados a la 
droga 


La sobredosis de heroína es la causa principal de mortandad entre los consumidores de 
esta droga. Es una de las causas de muerte más sorprendentes. Las víctimas rara vez toman 
más heroína antes de morir de la que utilizan normalmente. En ocasiones les sobreviene la 
muerte mientras la jeringuilla está todavía en el brazo de la víctima antes de que la per- 
sona haya acabado de inyectarse la cantidad que pretendía, Por tanto, las muertes relacio- 
nadas con la heroína rara vez están originadas en una excesiva cantidad de droga. ¿Por qué 
mueren, pues, los adictos? Una respuesta plausible se obtiene al aplicar el modelo de 
condicionamiento de tolerancia a la droga. Aquellos individuos con una targa historia de 
adicción a la heroína, poseen un conjunto de riruales que llevan a cabo cuando toman la 
droga. Pueden usar la droga sólo a ciertas horas, sólo en compañía de cierras personas, O 
sólo en lugares especiales. Podemos suponer que esos estímulos relacionados con la droga 
se condicionan al uso de la heroína. El modelo de condicionamiento predice que el ritual 
normal de administración de la droga provocará reacciones fisiológicas compensatorias de 
la heroína. Si los.adictos toman heroína a una hora inhabitual, con un grupo distinto de 
personas, o en un lugar nuevo, las respuestas condicionadas compensatorias no se produci- 
rán. Consecuentemente, la cantidad normal de heroína tendrá un efecto fisiológico mucho 
más intenso del que produce ordinariamente. Este efecto inesperadamente grande de: la 
droga puede ser suficiente para causar complicaciones físicas y la muerte. 

No todas las personas que experimentan una sobredosis de heroína mueren. Una aten- 
ción médica rápida puede salvarles la vida. Las entrevistas con supervivientes de una 
sobredosis de heroína indican que la reacción adversa a la droga se produce con frecuencia 
cuando se toma la heroína en circunstancias inhabituales. Los experimentos con animales 
también indican que la ausencia de estímulos condicionados a las drogas coloca a los suje- 
tos en riesgo creciente de muerte inducida por la droga (Siegel, Hinson, Krank y McCully, 
1982). En este experimento las ratas recibieron primero varias inyecciones de heroína 
asociadas con un conjunto distintivo de estímulos ambientales. A continuación se suminis- 
tró a los animales una dosis más alta de la droga de prueba. A algunos sujetos se les 
administró la dosis de prueba en presencia de los estímulos normales de administración de 
la droga. A otro grupo se le administró la droga en un ambiente donde el sujeto no había 
recibido heroína antes. La dosis de prueba de la heroína dio como resultado una propor- 
ción mayor de muertes entre los animales que recibían la droga en ausencia de claves 
ambientales condicionadas a la droga. Estos hallazgos apoyan una explicación del fenó- 
meno de la sobredosis de heroína en términos del modelo de condicionamiento de toleran- 
cia a la droga (para otras aplicaciones de la teoría del condicionamiento a problemas de 
adicción a las drogas y su tratamiento, véase Poulos, Hinson y Siegel, 1981). 





después del condicionamiento con drogas anticolinérgicas, el estímulo a 
nado provoca la dilatación de la pupila y un aumento de la nd e 
Sletten y Brown, 1966; Lang, Brown, Gershon y Korol, 1966). de e di a 
ción de la pupila es similar a la respuesta incondicionada a las dro 0 a 
que el aumento de la salivación es opuesto a los efectos E a os agen ; 

anticolinérgicos. Los distintos hallazgos hacen que el modelo de a 
compensatoria sea inadecuado como explicación general de la forma de a a 

puestas clásicamente condicionadas (véase las propuestas recientes en dE ación 
con los determinantes de las respuestas condicionadas a la droga en Eikelboom y 
Stewart, 1982; Matysiak y Green, 1984). 


El EC como determinante de la forma de la RC 


Según los modelos de condicionamiento que hasta ahora hemos o 
la forma de la respuesta condicionada está determinada por el estímulo Incon da 
cionado o por su representación. El modelo de la respuesta compensatoria SA 
tiene que la RC «compensará» los efectos del El. El modelo de la na a 
del El no es tan específico sobre la forma de la RC, pero también considera que 
naturaleza de la respuesta condicionada dependerá del El y de su acens 
Aunque han permitido identificar algunos factores determinantes de e aa leza 
de la respuesta condicionada, estos modelos son incompletos, pues la Pa E 
ción reciente indica que la forma de la RC también depende de la naturaleza de 

í ndicionado. ] 

a pa anterior de este capítulo discutimos de qué forma A 
distintos aspectos del estímulo condicionado en la velocidad a se AS e 
respuesta condicionada. La tasa del aprendizaje depende de la Al ad 7 da 
novedad del EC y de la relevancia del EC para con el El. Los aspectos de a u 

condicionado también influyen en la forma de la respuesta coda A. A un 
experimento poco común, Timberlake y Grant (1975) investigaron el con 2d 
namiento clásico en las ratas utilizando comida como estímulo incondiciona o 
Un costado de la cámara experimental estaba equipado con una apar E 
que podía meterse y sacarse de la cámara a través de una trampilla (véase f1gu- 
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ra 4.9). En vez de usar como estímulo condicionado una luz o un sonido conven- 
cionales, los experimentadores encerraban una rata viva en la plataforma que 
hacía de estímulo, Diez segundos antes de cada suministro de comida, a través de 
la trampilla se introducía en la cámara experimental la plataforma que transpor- 
taba la rata estímulo. Al término del ensayo se sacaba de la cámara a la rata 
estímulo. De esta manera, la presentación de la rata estímulo actuaba como estl- 
mulo condicionado a la comida. 

El modelo de la sustitución del estímulo predice que los sujetos experimenta- 
les llegarán a responder al EC condicionado a la comida del mismo modo que 
responden a la comida. Se espera, por tanto, que los sujetos roan O muerdan a la 
rata estímulo que hace de EC. No está claro qué predice en esta situación el 
modelo de la respuesta compensatoria. De hecho, cuando la rata EC se empare- 
¡aba repetidamente con la comida, el EC provocaba movimientos de orientación, 
de aproximación y olfateo, así como contactos sociales. Esas respuestas no apare- 
cían si la rata EC no se emparejaba con la comida o se presentaba de forma 
aleatoria con respecto a la comida. Este resultado no confirma ningún modelo que 
explique la forma de la respuesta condicionada exclusivamente en términos del 
estímulo incondicionado que se utilice, El patrón de respuestas condicionadas, en 
particular la conducta social provocada por la rata EC, estaba determinado, sin 
duda, por el inusual estímulo condicionado que se utilizó en este experimento 
(véase también Timberlake, 1983). Otras clases de ECs a la comida provocan 
respuestas condicionadas diferentes. Por ejemplo, Peterson y Otros (1972) inme- 
diatamente antes de presentar la comida a las ratas introducían una palanca ilu- 
minada dentro de la cámara experimental. Con la palanca de metal como estímulo 
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Figura 4.9. —Diagrama del experimento de Timberlake y Grant (1975). El estímulo condicionado que 

anuncia la comida es la presentación a través de una puerta colgante de una rata estímulo en una 

plataforma móvil situada en un lado de la cámara experimental. (Según Timberlake, mediante comu- 
nicación personal, 1980.) 
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condicionado las respuestas eran «casi exclusivamente orales y consistían sobre 


todo en lamer... y roer» (Peterson y otros, 1972, pág. 1010). 
Holland (1977) llevó a cabo una de las investigaciones más cuidadosas y sis- 


temáticas sobre el papel del estímulo condicionado en Ja determinación de la 
naturaleza de la respuesta condicionada. Holland comparó los estímulos visuales y 
auditivos en experimentos con ratas en los que se utilizaba comida como El. Los 
distintos tipos de claves auditivas condicionadas producían invariablemente sacu- 
didas de cabeza y reacciones de sobresalto y de colocación ante el plato de comida. 
Las reacciones de sacudida de cabeza y de sobresalto no se observaban con los 
estímulos condicionados visuales. Cuando se emparejaba con la comida una luz 
difusa, la respuesta condicionada predominante era colocarse al lado del plato de 
la comida. Cuando los estímulos condicionados visuales se localizaban en la parte 
superior de la cámara experimental, se observaba a menudo como respuesra con- 
dicionada una posición erecta sobre las patas traseras (véase también Holland, 
1980; Sigmundi y Bolles, 1983). 


La RC como tnteración entre los procesos conductuales innatos 
y condicionados 


Aunque no existe un modelo de ejecución de la respuesta que abarque todas 
las respuestas condicionadas clásicamente, en el pensamiento contemporáneo está 
empezando a tomar cuerpo un modelo basado en movimientos innatos patentes 
condicionados. La idea básica es que los efectos de un estímulo condicionado sobre 
la conducta provienen de una interacción entre las propiedades condicionadas del 
estímulo y el repertorio de conducras o tendencias innatas del organismo. Estímu- 
los tales como luces, sonidos y sabores son estímulos que provocan respuestas 
innatas sin un condicionamiento. Los animales también tienen reacciones innatas 
cuando están en una situación de expectativa de hechos biológicamente significa- 
tivos, como son la comida, el agua o el dolor cutáneo( Cuando luces, sonidos o 
comida se condicionan, las respuestas que provocan representan la integración de 
las respuestas innatas originales a esos estímulos y las respuestas innatas a la 
expectativa del estímulo incondicionado.) Esta concepción de la respuesta condi- 
cionada subraya que la forma della RC está determinada a la vez por la naturaleza 
del estímulo condicionado y por la naturaleza del estímulo incondicionado/ La 
naturaleza del BC es importante porque los animales presentan reacciones inna- 
tas diferentes ante los diversos estímulos antes del condicionamiento, y diferentes 
estímulos son capaces de mantener diferentes respuestas. (La naturaleza del estí- 
mulo incondicionado es importante porque determina en parte lo que los anima- 
les aprenden a esperar tomando como base el EC, y se supone que las diferente 
expectativas provocan respuestas innatas diferentes o tendencias de po 

La interacción entre los procesos conductuales condicionados e innatos a la 
hora de determinar la forma de la respuesta condicionada está cuidadosamente 
ilustrada en un experimento sobre condicionamiento con polluelos en el que se 
utilizaba calor como estímulo incondicionado. Cuando los polluelos, en su ambiente 
natural, tienen frío y buscan calor, se acercan a la madre, picotean en las plumas 
de la parte inferior del cuerpo de ésta y se acurrucan a su lado (frotan la cabeza 
contra la madre y la meten entre las plumas de ésta). El calor hace, por el contra- 
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rio, que los polluelos reduzcan la locomoción, extiendan las alas, gorjeen y cierren 
los ojos. En un experimento con pollitos, Wasserman (1973) utilizó como estí- 
mulo condicionado un pequeño disco iluminado y lo emparejó con una breve 
exposición al calor. A medida que el disco iluminado se condicionaba, los pollitos 
comenzaron a acercárse a él y a picotearlo. Más tarde, las respuestas de picoteo se 
hacían menos enérgicas y los pollitos empujaban el disco y meneaban la cabeza 
con movimientos parecidos a los de acurrucarse. Estas respuestas condicionadas 
eran muy diferentes de las reacciones que se daban ante el estímulo incondicio- 
nado de calor. Sin embargo, muestran claramente qué es lo que hacen los pollitos 
de forma natural cuando esperan recibir calor de la madre. Dado el procedimiento 
de condicionamiento utilizado, la respuesta natural de búsqueda de calor se acaba 
dirigiendo hacia el estimulo condicionado. (véase también Hogan, 1974; Jenkins, 
Barrera, Ireland y Woodside, 1978; Timberlake, 1983a, 1983b, Wasserman, 1974, 
1981b). 

La idea de que la respuesta condicionada es producto de una interacción entre 
procesos conductuales innatos y condicionados es un avance prometedor de la 
teoría de la conducta. Sin embargo, todavía falta mucho para que la hipótesis 
permita predecir la forma de las respuestas condicionadas. En muchos casos no 
sabemos con exactitud cuáles son las respuestas innatas del anima! ante la expec- 
tativa de un estímulo incondicionado concreto. La hipótesis tampoco especifica la 
forma en que las reacciones innatas ante la expectativa de un hecho biológica- 
mente significativo se «integran» con las reacciones innatas al estímulo que va a 
hacer de EC. Es preciso todavía investigar más profundamente sobre las relacio- 
nes entre la conducta instintiva y los procesos de condicionamiento para que se 
resuelvan esos detalles. 


Un enfoque funcional-adaptativo de la RC 


Los modelos de respuesta condicionada que se han considerado hasta ahora 
nos han ofrecido algunas sugerencias sobre los mecanismos de la conducta condi- 
cionada y han identificado factores concretos que determinan la forma de la res- 
puesta condicionada. Sin embargo, no se ha planteado de forma explícita la cues- 
tión de por qué existen esos mecanismos: por qué son esos mecanismos y no 
otros los que configuran la conducta condicionada. Ésta cuestión es el punto cen- 
tral "de un enfoque funcional-adaptativo de la respuesta condicionada (véase 
Hollis, 1982, 1984b; Shertleworth, 1983a). 

Una reflexión informal revela que las respuestas clásicamente condicionadas 
con frecuencia son beneficiosas para el sujeto. La salivación anticipatoria acelera 
la digestión, el aprendizaje de aversión a la comida venenosa reduce las ingestio- 
nes subsiguientes de comida nociva, la analgesia condicionada reduce el malestar 
producto de un estímulo doloroso, y las respuestas compensatorias condicionadas 
a las drogas reducen los trastornos fisiológicos que causa la administración de una 
droga. Hace tiempo que los efectos beneficiosos de las respuestas condicionadas 
son evidentes, como lo revela la siguiente cita: 


(Sin una señal) el animal se vería forzado en cualquier situación a esperar a que llegara el 
estímulo para empezar a encrar en contacto con él, Tendría siempre colgado delante de sus 
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ojos el velo del futuro. Hace tiempo que la naturaleza empezó a correr ese velo. Se ha demos- 
trado que la previsión posee un alto valor de supervivencia, y el condicionamiento es el medio 
para poder prevenir. Era, sin duda, esta previsión la que otorgaba a los receptores a distancia 
la mayor parte de su valor. Ni la visión ni el ruido del enemigo que se acerca son Intriniseca- 
mente perjudiciales; sin el condicionamiento, estos exteroceptores habrían perdido su signifi- 
cado filogenético (Culler, 1938, pág. 136). 


De acuerdo con esta interpretación, los animales han evolucionado para dar 
respuestas condicionadas porque estas respuestas les permiten prepararse para el 
estímulo incondicionado. El condicionamiento permite al animal «introducir 
cambios preparatorios ante el estímulo que se aproxima» (Culler, 1938, pág. 136). 

¿Por qué debe hacer el animal unos «cambios preparatorios»? Como implica 
la cita anterior, los «beneficios» biológicos de las respuestas condicionadas se 
miden por su contribución al ajuste biológico y el éxito reproductivo. Al respon- 
der de una forma concreta a la inminente presentación de un estímulo incondi- 
cionado, los sujetos aumentarán sus probabilidades de sobrevivir y reproducirse, 
pasando sus genes a las generaciones futuras. Así pues, se supone que(la forma de 
la respuesta condicionada es adaptativa y contribuye al ajuste biológico del 
Organismo. : 

Es importante advertir que el enfoque funcional-adaptativo no constituye una 
alternativa a los determinantes de la respuesta condicionada que se discutieron 
anteriormente. La pretensión de que las respuestas condicionadas son adaptativas 
no especifica el modo en que los distintos factores que anteceden a la respuesta 
condicionada, como. la naturaleza del estímulo condicionado y el incondicionado, 
determinan la forma de la respuesta condicionada, En cierto sentido, el enfoque 
adaptativo-funcional especifica los fines biológicos (el ajuste) que pueden tener 
las respuestas condicionadas, pero no los mecanismos que originan las respuestas 
condicionadas. La analogía con un automóvil puede aclarar esta distinción. La 
función de un automóvil es transportar personas y cosas. Sin embargo, el especifi- 
car su función no nos dice nada sobre los mecanismos del automóvil: por ejemplo, 
si lleva motor diesel o de gasolina. 

Dado que el enfoque funcional-adaptativo se centra en las funciones de la 
respuesta condicionada más que en los mecanismos que la producen, la cuestión 
de la conducta condicionada se trata desde una perspectiva diferente a la de otros 
modelos que hemos considerado. Esta nueva perspectiva puede conducirnos a 
investigaciones de condicionamiento innovadoras. Shettleworth (1983a) ha pro- 
puesto que de la reflexión sobre las funciones del aprendizaje pueden despren- 
derse sugerencias sobre los posibles mecanismos implicados. La reflexión sobre 
las funciones de la respuesta condicionada ha estimulado también el estudio de 
nuevas e interesantes formas de condicionamiento. Hollis (1984b), por ejemplo, 
ha descubierto que los peces territoriales macho (gouramis) logran defender 
mejor su territorio cuando el intruso viene señalado por un EC que cuando el 
intruso aparece sin avisar. En los machos de estas especies es más probable la 
conducta de cortejo cuando se señala la aparición de la hembra con un EC que 
cuando el intruso aparece inesperadamente. La ventaja reproductiva de las res- 
puestas condicionadas se hace evidente también en trabajos con ratas sobre condi- 
cionamiento clásico de la conducta reproductiva. Graham y Desjardins (1980) han 
mostrado que en las ratas macho un EC olfativo emparejado con la presentación 
de una hembra sexualmente receptiva provoca la liberación de la hormona sexual 
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ilustra el modo en que las reflexiones sobre funcionalidad pueden llevar al descu- 
brimiento de un fenómeno nuevo y totalmente inesperado según las considera- 
ciones teóricas más tradicionales. 

Como ya advertimos antes, un análisis funcional no sustituye las investigacio- 
nes de los mecanismos de la conducta. Aunque las funciones del efecto de poten- 
ciación están claras, sus mecanismos no lo están. De hecho, el análisis del fenó- 
meno de la potenciación ha originado gran controversia (por ejemplo, Durlach y 
Rescorla, 1980; Lett, 1982), y todavía no comprendemos con claridad la razón de 
que un EC potencie el condicionamiento de un segundo EC en algunas situaciones 
y ensombrezca el condicionamiento de un segundo EC en otras circunstancias. 


¿COMO SE ASOCIAN LOS ESTIMULOS CONDICIONADOS 
E INCONDICIONADOS? 


Hemos descrito numerosas situaciones en las que se produce el condiciona- 
miento clásico y hemos hablado de varios factores que determinan las respuestas 
que se derivan de este aprendizaje. Sin embargo, tenemos todavía que tratar con 
detalle el problema esencial de la forma en que se asociam los estímulos condicio- 
nados e incondicionados. ¿Cuáles son los mecanismos del aprendizaje por asocia- 
ción, los procesos subyacentes que se activan intensamente con los procedimien- 


“ tos de condicionamiento que producen un aprendizaje rápido, y que se activan 


débilmente con procedimientos menos eficaces para producir aprendizaje? En el 
capítulo anterior comentamos brevemente los mecanismos de aprendizaje cuando 
hicimos la observación de que el condicionamiento clásico no se producía sim- 
plemente por las presentaciones contiguas del EC y el El. Más bien, la relación de 
señal, o contingencia, entre el EC y el El, es esencial para que se produzca apren- 
dizaje. ¿Cómo detecta el organismo esas relaciones de señal y cómo influyen en el 
aprendizaje de asociaciones? Estas cuestiones y otras parecidas han sido tema de 
estudio intenso durante los últimos veinte años. De este esfuerzo han surgido 
muchas ideas nuevas, y el resultado ha sido que nuestra concepción sobre el con- 
dicionamiento clásico ha cambiado radicalmente. La evolución de las teorías del 
condicionamiento clásico continúa hoy. Los investigadores se esfuerzan por for- 
mular explicaciones amplias de los mecanismos del aprendizaje por asociación 
que puedan abarcar todos los resultados de las distintas investigaciones. 


Dos concepciones del proceso de adquisición 


Uno de los hechos fundamentales del condicionamiento clásico es que no 
todos los emparejamientos del EC con el El producen el mismo aumento en la 
ejecución de la respuesta condicionada. La figura 4.10 muestra una curva hipoté- 
tica de aprendizaje en el condicionamiento clásico, Los primeros emparejamientos 
del EC y el El producen grandes aumentos en la ejecución de la respuesta condi- 
cionada. Así, en un principio, cada punto de la curva de aprendizaje es más alto 
que el anterior. Estos cambios en la respuesta condicionada vienen representados 
por ARC en la figura 4.10. (El símbolo A, delta, se usa para representar el incre- 
mento.) Á medida que el condicionamiento avanza, el aumento en la ejecución de 
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la respuesta condicionada se hace mucho más pequeño de cada emparejamiento 
EC-El. El valor de ARC va disminuyendo cada vez más. Después de un entrena- 


miento suficiente, se alcanza un nivel estable de respuestas, y. el ARC tiende a, 


A A 


cero. Esta parte, de la curva de aprendizaje se llama asíntota. 

“¿Por qué en los primeros ensayos de condicionamiento se producen unos 
aumentos mucho mayores en la ejecución de la respuesta condicionada que en los 
ensayos posteriores? No se puede atribuir este efecto a la fatiga o al descenso de 
la motivación, puesto que se obtienen los mismos resultados cuando se realiza un 
ensayo al día. Existen dos explicaciones plausibles. Una de ellas analiza la curva 
de aprendizaje de acuerdo con los cambios en la capacidad del estímulo condicio- 
nado para asociarse con el El o aumentar la fuerza asociativa. Según esta concep- 
ción, en el transcurso del condicionamiento el EC va perdiendo gradualmente su 
capacidad para asociarse con el El. Se supone que, inicialmente, el EC tiene una 
gran capacidad para asociarse con el El. Sin embargo, cuanto más se condiciona el 
EC, más difícil le resulta al EC aumentar su asociación con el El. Esta idea puede 
denominarse hipótesis de la reducción del EC. A medida que el condiciona- 
miento avanza, di isminuye la capacidad del. EC. dé aumentar la fuerza asociativa. 


“Como la capacidad asociativa del EC se reduce gradualmente, los aumentos de lá: 


Tespuesta condicionada se hacen progresivamente menores hasta que se alcanza la 
“asíntota.y. el aprendizaje se acaba. 

Un segundo enfoque en el análisis de la adquisición sostiene que existen cam- 
bios en la capacidad del estímulo incondicionado para producir aprendizaje. Según 
esta idea, el estímulo incondicionado es totalmente eficaz durante los primeros 
ensayos de condicionamiento, y por tanto produce grandes aumentos de la res- 
puesta condicionada, Sín embargo, conforme progresa el entrenamiento, el El 
pierde gradualmente su capacidad de producir un condicionamiento de la situa- 
ción, y los aumentos de la respuesta condicionada cada vez son menores. Cuando 
llega a la asíntota se supone que el El es totalmente incapaz de producir más 
condicionamiento, y que ARC es cero. Esta concepción puede denominarse hipó- 
tesis de la reducción del El. Á medida que avanza el condicionamiento, la efica- 


Figura 4.10.—Curva ideal de 
aprendizaje. La magnitud de la 
respuesta condicionada se incre- 
mentó 2 unidades (ARC=2) 
entre el primer y el segundo 
ensayos de condicionamiento; 0,7 
unidades (ARC=—0,7) entre los 
ensayos séptimo y octavo, y O 
unidades (ARC=0) entre los 
ensayos decimocuarto y decimo- 
quinto. 
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cia del El se reduce gradualmente, y cada vez se produce menos condicionamiento. 

Las teorías contemporáneas sobre aprendizaje difieren en su concepción del 
proceso de adquisición. Unas teorías hacen hincapié en los cambios del EC en el 
transcurso del condicionamiento clásico, mientras que otras resaltan los cambios 
en el El. Vamos a empezar nuestra discusión sobre las teorías del aprendizaje por 
asociación explorando la idea de que la capacidad del El para producir un nuevo 
aprendizaje se altera como resultado del condicionamiento. Esta idea la fomenta- 
ron los investigadores del efecto de bloqueo en el condicionamiento pavloviano. 
Dado el papel central que el efecto de bloqueo ha tenido en los desarrollos teóri- 
cos contemporáneos, vamos a tratar sobre él a confinuación. 


El efecto de bloqueo 


Los animales condicionados fuera del laboratorio habitualmente se encuentran 
con numerosos estímulos. Los hechos que señalan peligro, por ejemplo, pueden 
contener múltiples estímulos visuales, auditivos y olfativos. Para el organismo, lo 
más ventajoso es considerar sólo aquellas claves que señalan el peligro de manera 
más eficaz. Es preferible olvidarse de otras claves que, o bien no señalan el peli- 
gro convenientemente, o son redundantes. De otra forma, el organismo podria 
estar en un constante estado de alerta o de tensión, preparado para huir o luchar 
innecesariamente. La hipótesis de la reducción del El sugiere la manera de evitar 
que se condicionen los estímulos redundantes o que no informan adecuadamente. 
Condicionando un EC con un El concreto hasta llegar a la asíntota se reduce la 
capacidad del El para producir más condicionamiento en esa situación. Por tanto, 
si se añade un nuevo EC a la situación, se producirá muy poco condicionamiento 
-del nuevo estímulo, si es que se produce alguno, Se ha. llegado a esta conclusión 
«gracias a-una serie de experimentos sobre lo que se ha dado en llamar efecto de 
bloqueo. Estos experimentos, iniciados por Leon Kamin, describen los casos 


“especificós en los que los procedimientos de condicionamiento no condicionan 


El efecto de bloqueo se ha investigado muy extensamente utilizando el proce- 
dimiento de supresión condicionada con ratas (Kamin, 1968, 1969). El procedi- 
miento comprendía tres fases (véase figura 4.11). En la fase primera el grupo 
experimental recibía emparejamientos repetidos del estímulo condicionado Á con 
el estímulo incondicionado. Esta fase del experimento continuaba hasta que el 
estímulo Á se condicionaba hasta llegar a la asíntota, es decir, hasta que el animal 
suprimía completamente sus respuestas de presión de la palanca al presentarle el 


estímulo A. El condicionamiento del estímulo A reducía presumiblemente la efi- 


cacia del estímulo incondicionado, Para evaluar la pérdida de eficacia del El, se 


Grupo Fase 1 Fase 2 Prueba Figura 4.11.—Diagrama del pro- 
cedimiento de bloqueo. Durante 
Experimental A — El [A+B] — El B la fase 1, el estímulo A es condi- 


cionado con el El en el grupo 
Coma [A+B] — El B experimental, mientras que el 

grupo de control no recibe ensa- 
yos de condicionamiento. Durante la fase 2 ambos grupos, experimental y de control, reciben ensayos 
de condicionamiento en los cuales el estimulo A y el estímulo B se presentan simultáneamente y 
emparejados con el El, Una prueba posterior de la respuesta al estímulo B aislado muestra que se 
obtiene un menor condicionamiento al estimulo B en el grupo experimental que en el de control. 
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hizo un intento de condicionar un nuevo estimulo, B, con el mismo El. En la fase 
segunda del procedimiento, los estímulos A y B se presentaron simultáneamente 
y se emparejaron con el El, Después de varios de estos ensayos de condiciona- 
miento, el estímulo B se presentó solo en un ensayo de prueba para ver hasta 
qué grado los animales aprendían a suprimir su conducta en presencia del estimu- 
lo B. El grupo de control recibió el mismo entrenamiento en la fase segunda con 
el estímulo B que los sujetos experimentales, pero a ellos no se les condicionó el 
estímulo A enla fase primera. Por lo tanto, el El no iba a reducir su eficacia en la 
fase segunda. La hipótesis de la reducción del El predice un menor condiciona- 
miento del estímulo B en el grupo experimental que en el grupo de control. ¡La 
"prueba con el estímulo B presentado solo, al final del experimento, confirmó 
estos resultados. En muchas repeticiones del experimento, el estímulo B producía 
invariablemente menos supresión condicionada de la conducta en el grupo expe- 
rimental que en el grupo de control. | 

El efecto de bloqueo es curioso porque las nociones informales, o de sentido 
común, sobre condicionamiento clásico no podían predecirlo. Por ejemplo, el 
efecto de bloqueo indica claramente que el condicionamiento clásico no tiene 
lugar simplemente porque se presente el estímulo condicionado junto con el 
estímulo incondicionado. Durante la fase segunda del experimento de bloqueo 
(véase figura 4.11), el estímulo B se empareja con el El de forma idéntica en el 
grupo experimental que en el de control. Si el emparejamiento del EC y el El 
bastara para que se diera el condicionamiento, el estímulo B se condicionaría en 
ambos grupos. El hecho de que el estímulo B se condicione sólo en el grupo de 
control es una prueba fehaciente de que el emparejamiento del EC y el El no 
basta para producir aprendizaje. Qué otros factores son necesarios constituye una 
cuestión fundamental del condicionamiento clásico. 

Además de demostrar el efecto de bloqueo, Kamin (1968, 1969) realizó 
muchos experimentos para averiguar qué aspectos de este procedimiento causa- 
ban la interferencia con el condicionamiento del estímulo B en el grupo expert- 
mental. Estos-experimentos y otros han mostrado que el (condicionamiento del 
estímulo B se bloquea si el estímulo B es redundante, es decir, si B no añade 
ninguna información acerca del El. Para que se cumpla este requisito existen dos 
aspectos del procedimiento de bloqueo que son esenciales. En primer lugar, el 
estímulo A debe presentarse junto con el estímulo B. Segundo, el estímulo A 
tiene que predecir adecuadamente el El durante los ensayos de condicionamiento 
del estímulo B/Estas características aseguran que el estímulo A es suficiente por 
si solo para señalar el El, y el B es redundante (innecesario). Si no se cumplen las 
condiciones que hacen redundante el estímulo B, el bloqueo no se-producirá. Por 
ejemplo, el estímulo A no bloquea el condicionamiento del estímulo B si el estímu- 
lo A no se presenta durante la fase segunda (véase figura 4.11). El bloqueo tam- 
poco se produce si el estímulo A no se condiciona con el El durante la fase 
primera, o si las propiedades condicionadas del estímulo A se extinguen entre las 
fases primera y segunda. En ambos casos el resultado es que el estimulo A no 
señala las apariciones del El durante la fase segunda, y por tanto, el estímulo B no 
es redundante, Estos hallazgos indican que el condicionamiento del estímulo A 
hasta la asíntota no reduce la eficacia del estímulo incondicionado en cualquier 
circunstancia, Más bien lo que ocurre es que la eficacia del El se reduce sólo en las 
situaciones en que el estímulo A señala el estímulo incondicionado. Cuando el 
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estímulo A está ausente, o se ha extinguido y ya no señala más el El, la eficacia 
del estímulo incondicionado vuelve al máximo. 

¿Por qué el El no condiciona a un estímulo redundante? La presencia del 
estimulo A durante los ensayos de condicionamiento del estímulo B, en la fase 
segunda del procedimiento de bloqueo, hace que el El sea totalmente predecible. 
Así pues, el El no produce sorpresa en la fase segunda. Estas consideraciones le 
sugirieron a Kamin que el estímulo incondicionado tenía que ser «sorprendente» 
para producir condicionamiento.)Si el estímulo incondicionado no es sorpren- 
dente, el animal no se sobresalta y no se estimula el «esfuerzo mental» necesario 
para la formación de una asociación. Los hechos esperados no exigen ajustes del 
organismo y, por tanto, no estimulan un nuevo aprendizaje. Por definición, los 


hechos inesperados son estímulos para los que el organismo no está ajustado. Por . 


tanto, es más probable que los hechos as un nuevo aprendizaje. 


El modelo de condicionamiento de Rescorla- Wagner 


La idea de que el estímulo incondicionado tiene que sorprender para promo- 
ver él condicionamiento clásico és un concepto “central-de las teorías contempo- 


ránéas sobre. condicionamiento. Robert Rescórla y Allan Wagner (Rescórla y 





“Wagner, 1972; Wagner y Rescorla, 1972) fueron tíños de los primeros en desarro- 


Lp 


4 


llar esta idea de una forma sistemática dentro“dé ina teorfa más ámplia sobre . 


condicionamiento. Estos investigadores formularon un modelo matemático del 
concepto de «sorpresividad» del El. El modelo matemático tiene dos ventajas 
importantes sobre las anteriores descripciones verbales de la idea. En primer 
lugar supone un tratamiento más preciso del concepto de sorpresividad del El. En 
segundo lugar, con el uso de derivadas matemáticas y simulaciones por ordenador, 
las implicaciones del concepto de sorpresividad del El pueden extenderse a una 
amplia variedad de fenómenos de condicionamiento. Consecuentemente, el mo- 
delo de Rescorla-Wagner dominó la investigación sobre condicionamiento clásico 
hasta aproximadamente diez años después de su formulación. No vamos a descri- 
bir con detalle el tratamiento matemático de Rescorla y Wagner pero sí expon- 
dremos la base conceptual y las implicaciones de la teoría. 

¿Cómo podríamos medir la sorpresividad de un estímulo incondicionado? 
¿Qué quiere decir que algo es sorprendente? Por definición, un hecho es sorpren- 
dente si es diferente de lo que esperábamos. Una diferencia grande entre lo que 
esperamos y lo que ocurre provoca que el desenlace sea sorprendente. Si espera- 
mos un pequeño regalo de cumpleaños y recibimos un coche, nos sorprenderemos 
mucho. Por el contrario, si la diferencia entre lo que se espera y lo que ocurre es 
pequeña, el resultado no es muy sorprendente. Si esperamos un regalo pequeño y 


eso es efectivamente lo que nos dan, no nos sorprendemos demasiado, Rescorla y... 


Wagner formalizaron estas nociones.con la suposición de que la sorpresividad, :y--. 


"Bór tanto la eficacia del El, depende de la diferencia entre lo que el El es y lo que 


“ el sujeto espera. Además, se pensó que la expectación ante el El dependía de. un 


aprendizaje previo: Se suponé' que la expectación ante el El es un reflejo de lo 
sien que se hubiera condicionado el EC,.es decir, un reflejo de la fuerza asociativa 


del EC. 
“--Wamos a considerar de qué manera esas ideas relativamente simples pueden 


A 


_ da 
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explicar una curva de aprendizaje típica del condicionamiento clásico (véase 
figura 4.10). En el primer ensayo de condicionamiento, el sujeto no tiene razón 
alguna para esperar el El, porque todavía no ha aprendido que el El seguirá al EC. 
Por lo tanto, el El es sumamente sorprendente y produce mucho aprendizaje. Á 
causa de este aprendizaje el sujeto adquiere alguna expectativa de que el El se 
presente tras el EC, lo que hace al El menos sorprendente en los ensayos subsi- 
guientes. Por lo tanto se da menos aprendizaje nuevo en los ensayos subsiguien- 
tes. Este proceso continúa hasta que se puede predecir perfectamente el El a 
partir del EC, hasta el momento en que el El deja de tener un valor de sorpresa. 
Ya no se da más aprendizaje y se alcanza la asíntota, 

Como ilustra este ejemplo, el modelo de Rescorla y Wagner concibe el apren- 
dizaje como el ajuste de las expectativas a lo que realmente ocurre. Si las expecta- 
tivas no se corresponden con precisión al El que se va a presentar, se reajustan. 
Este reajuste de expectativas continuará hasta que coincidan las expectativas y los 
resultados de los ensayos de condicionamiento. El aprendizaje cesa cuando dejan 
de existir discrepancias entre las expectativas y los resultados. Si podemos prede- 
cir perfectamente el El a partir del EC, hemos adquirido un conocimiento com- 
pleto de la relación de señal entre el EC y el El, y ya no va a producirse más 
aprendizaje acerca de la asociación entre los dos estímulos. 

Las ideas fundamentales del modelo de Rescorla-Wagner también predicen el 
efecto de bloqueo con tal de que además se asuma que la expectativa ante el El se 
basa en todas las claves de las que dispone el sujeto. El grupo experimental en el 
diseño del bloqueo recibe primero un condicionamiento extenso del estímulo A, 
de forma que adquiere una expectativa perfecta de que el El tendrá lugar en 
cuanto se encuentre con el estimulo A (véase figura 4.11). En la fase segunda, el 
estimulo B se presenta junto con el estímulo A, y los dos ECs van seguidos del El. 
Según el modelo de Rescorla-Wagner, el no condicionamiento del estímulo B 
ocurre en la fase segunda, porque el El es totalmente esperado en esta fase, 
debido a la presencia del estimulo A. Los sujetos del grupo de control reciben un 
entrenamiento idéntico en la fase segunda, pero la presencia del estímulo A no 
les lleva a una expectativa del El. Por lo tanto, el El es sorprendente en el grupo 
de control y produce nuevo aprendizaje. 

Aunque el modelo de Rescorla-Wagner se corresponde con los hechos funda- 
mentales del cóndicionamiento clásico, como son la adquisición y el efecto de 
bloqueo, gran parte de su importancia proviene de sus predicciones inusuales 
acerca del aprendizaje. Predice, por ejemplo, que en determinadas circunstancias, 
los estímulos condicionados pierden su fuerza asociativa a pesar de que continúen 
emparejándose con el El. ¿Cómo puede ocurrir esto? Recuérdese que el modelo 
concibe el aprendizaje corno el ajuste de las expectativas a los resultados. Al prir- 
cipio del condicionamiento, por ejemplo, el EC no predice correctamente el El 
que va a aparecer. Por ello, el sujeto recibe más El del que esperaba, y el ajuste 
resultante es un «aumento» de la expectativa ante el El. Sucede lo contrario si el 
sujeto recibe «menos» El del que espera. En ese caso el ajuste resultante es un 
«descenso» de la expectativa de El o de la fuerza asociativa. Esto puede ocurrir 
aun en el caso de que se siga presentando el El, como en el diagrama del experi- 
mento de la figura 4.12. 

El experimento de la figura 4.12 comprende dos fases. En la primera fase los 
sujetos reciben ensayos de condicionamiento en los que el estímulo A se empareja 


ll ln 


die 


e yo 
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Fase 1 Fase 2 Figura 4.12.—Pérdida de fuerza 
asociativa a pesar de la presen- 

AH [AFB] — El tación continuada de estímulos 
B — El El. Los estímulos A y B son 


condicionados separadamente para llegar a la asíntora en la fase 1 de modo que cada EC prodiga 


dos simultáneamente y pareados 

fectamente el El. En la fase 2, los estímulos A y B son presenta : 

00 <l mismo El utilizado en la fase 1. Esto produce una expectativa desmedida del El. Debido a que el 

El es sorprendentemente pequeño al comienzo de la fase 2, las fuerzas asociativas de los estímulos A y 

B decrecen hasta que la presentación simultánea de los 2 EC no vuelva a producir una expectativa 
desmedida. 


_— 
con el El, y ensayos en los que el estímulo B se empareja con el mo aro 
ejemplo, una bolita de comida). En la fase primera continúa € con : o ten 
de los estímulos A y B en ensayos separados hasta que ambos estímulos se co Al 
cionan hasta la asíntota: los dos predicen perfectamente el El de ua po 1 a 
comida. Se inicia entonces la fase segunda. En esta fase los estímulos y se 
presentan simultáneamente, seguidos del mismo El, una bolita de a a. La 
cuestión es qué les ocurre a las fuerzas asociativas de los esc os A y a no 
resultado del adiestramiento de la fase segunda. Obsérvese que e mo , q 
se utilizó en la fase primera continúa presentándose en la fase segunda ado que 
no exiscen cambios en el El, una reflexión informal sugiere que las erzas asocia 
tivas de los estímulos A y B deberían también permanecer inalteradas ran z 
fase segunda. En contraste con esta predicción de sentido común, el modelo 


Rescorla-Wagner predice que las fuerzas asociativas de los estímulos individuales 


descienden en la fase segunda.. 

o omo resultado del adiestramiento de la fase primera, los estímulos A ! B 
llegan a predecir el El de una bolita de comida. Se supone que cuando, co! . ase 
segunda, los estímulos A y B se presentan simultáneamente por po : ez, pe 
expectativas puestas en cada uno de ellos se suman, lo cual da gar, s AN 
sujetos esperen un El de dos bolitas de comida. Esta expectativa es : es nece 
porque el El sigue siendo una única bolita de comida. Así pues, existe a 
pancia entre lo que se espera y lo que ocurre de hecho. Al principio o Pe 
segunda los sujetos encuentran que el El es sorprendentemente peque » e 
llevar las expectativas de El al nivel de lo que realmente e a A 
segunda, los sujetos tienen que disminuir sus expectativas : A . Deo 
estímulos A y B. Así pues, podemos predecir que los estímulos Á y o en 
fuerza asociativa a pesar de las presentaciones continuadas del miso MA 
bién se puede predecir que la fuerza asociativa seguirá decreciendo asta a en 
presentación simultánea de A y B no anuncie más que una bo 1 e com Ma 
previsible disminución de la respuesta condicionada a los esco individua es A 
y B que se produce en este tipo de procedimiento ya contra toda intuición, p 

ha sido verificada experimentalmente (véase Kremer, 1978). o 

El modelo de Rescorla-Wagner estimuló el desarrollo de muchas investigacio 

nes y llevó al descubrimiento de muchos fenómenos importantes de com tcona- 
miento clásico que probablemente no se habrían investigado si no E xs 
tido esta teoría. Sin embargo, el éxito del modelo no ha sido comp so n pame 
lugar, el modelo se refiere tandamentalmente a las relaciones de señal (exp cra 
vas del El basadas en la presencia del EC) y por tanto no se centra cn oros 
aspectos del condicionamiento clásico. Por ejemplo, el modelo no dice nada 
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de lo que determina la forma de las respuestas condicionadas clásicamente. “Tam- 
poco se refiere a los casos de condicionamiento clásico en los que no intervienen 
relaciones de señal, como el precondicionamiento sensorial que se realiza presen- 
tando de forma simultánea los estímulos que se van a asociar (véase pág. 80 del 
original). El modelo de Rescorla-Wagner ha encontrado también algunas dificul- 
tades para explicar ciertos fenómenos en los que presumiblemente intervienen 
relaciones de señal. En particular, ha tenido dificultades para explicar algunos 
resultados del condicionamiento inhibitorio (por ejemplo, Zimmer-Hart y Res- 
corla, 1974). 


Modelos alternativos de reducción del El 


Las deficiencias del modelo de Rescorla-Wagner, así como la aparición de 
ideas nuevas procedentes de otras áreas de investigación, han estimulado modelos 
alternativos de reducción del El en el condicionamiento clásico. Estos modelos no 
se han comprobado todavía tan extensamente como el modelo de Rescorla- 
Wagner, pero parece que abren nuevas y prometedoras vías de investigación 
sobre los mecanismos del aprendizaje asociativo. Una de ellas, la teoría del opo- 


nente condicionado (Schull, 1979), se basa en la teoría del proceso oponente... 
descrita en el capítulo 2, y en cierta forma supone Wa extensión del modelo de la 
respuesta compensatoria del condicionamiento clásico descrito “antes en el pre- 


“sente capítulo. Esta teoría sostiene qué ciatido-un-EC se empareja cón un El, 


proNoS diversas. respuestas condicionadas, úna de las Cuales acarrea cambios fisio- 


lógicos. que se oponen, o que compensan, a los efectos del El” A medidá”que ' 


avanza el condicionamiento, aumenta la capacidad del EC para provocar esta res- 
puesta Oponente condicionada (la respuesta fisiológica compensatoria). Dado que 
la respuesta condicionada compensa los efectos del El, sirve para reducir el 
impacto del estímulo incondicionado. El impacto del El se reduce cada vez más 
conforme prosigue el condicionamiento. Se supone que en la asíntota la respuesta 
oponente condicionada es lo suficientemente fuerte como para eliminar por com- 
pleto el impacto del El, y el condicionamiento deja de aumentar. Por tanto, la 
teoría del oponente condicionado explica el desarrollo típico de la adquisición del 
condicionamiento clásico en términos de la reducción de la eficacia del El. A 
diferencia del modelo de Rescorla-Wagner, este otro modelo sostiene que se 
reduce el El porqueyel EC provoca una fuerte respuesta oponente condicionada, 
no porque el EC Haga que el El deje de ser sorprendente. 

La teoría del oponente condicionado predice muchos de los fenómenos que la 
teoría de Rescorla-Wagner también predecía. Por ejemplo, acierta en la explica- 
ción del efecto de bloqueo, al igual que lo hizo la teoría de Rescorla-Wagner. 
Recuérdese que, para producir el efecto de bloqueo, primero se condiciona a los 
sujetos al estímulo A hasta llegar a la asíntota. Después se presenta el estímulo A 
junto al estímulo B, y las dos claves juntas van seguidas del El. La presencia del 
estímulo A durante esta segunda fase bloquea el condicionamiento del estímulo B. 
La teoría del oponente condicionado explica este resultado suponiendo que el 
estímulo A, dado su condicionamiento previo, provoca una fuerte respuesta opo- 
nente condicionada. El impacto del El se reduce, por tanto, cuando el estímulo A 
y B se emparejan con el El, y el reducido impacto del El es el responsable de la 
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falta de condicionamiento del estímulo B (para otras implicaciones de la teoría del 
oponente condicionado, véase Schull, 1979). 

La teoría del oponente condicionado es prometedora porque integra varias 
líneas teóricas (la teoría del proceso oponente, la teoría de la respuesta compensa- 
toria y el modelo de Rescorla-Wagner.) Sin embargo, en su formulación original 
era demasiado vaga para permitir una evaluación experimental precisa. Las ideas 
clave han sido posteriormente desarrolladas a través de una teoría matemática del 
condicionamiento muy precisa propuesta recientemente por Wagner (1981; véase 
también Donegan y Wagner, 1981; Mazur y Wagner, 1982, Wagner y Larew, 
1985). 


Modelos de modificación del EG—-" 


Los investigadores han explorado también la posibilidad de que varios fenó- 
menos de condicionamiento clásico reflejen cambios en la capacidad del EC para 
asociarse con el El, más que cambios en la capacidad del El para producir condi- 
cionamiento. Los modelos de modificación del EC resaltan que para que tenga 
lugar el condicionamiento, el EC tiene que ser notorio o destacado; tiene que 
llamar la atención del sujeto. Se supone que la notoriedad de un EC en un ensayo 
de condicionamiento determina la cantidad de condicionamiento que tiene lugar 
en ese ensayo. Si un estímulo pierde su notoriedad y ya no destaca, los sujeros 
dejarán de aprender sobre él 

Los distintos modelos de modificación del EC difieren en sus consideraciones 
sobre lo que determina la notoriedad del EC en un ensayo concreto. Pearce y Hall 
(1980; véase también Hall, Kaye y Pearce, 1985) suponen, por ejemplo, que la 
atención que prestan los sujetos al EC. en un ensayo concreto está determinada 
por lo sorprendente que fuera el El en el ensayo anterior. Los sujetos tienen 
mucho que aprender en las situaciones en que el El es sorprendente. Por tanto, sí 
el EC va seguido de un El sorprendente, los sujetos prestarán más atención al EC 
en los ensayos siguientes. Se supone que un El sorprendente aumenta la notorie- 
dad del EC. Por el contrario, si un EC va seguido de un El esperado, los sujetos 
prestarán menos atención al EC en el ensayo siguiente. Se supone que un El 
esperado hace descender la notoriedad del EC. 

El modelo de Pearce y Hall concuerda con muchos hallazgos corrientes en 
condicionamiento clásico. Por ejemplo, explica el curso normal de adquisición de 
una respuesta condicionada (figura 4.10) pues considera que la sorpresividad del 
El al principio del condicionamiento hace que los sujetos presten más atención al 
EC, y esto da como resultado un significativo aumento En el condicionamiento. 
Conforme prosigue el aprendizaje, el El se hace menos sorprendente. Esto reduce 
la cantidad de atención que los sujetos prestan al EC, lo que provoca una disminu- 
ción en el aprendizaje. La asíntota, o límite del condicionamiento, se alcanza 
cuando el El se puede predecir perfectamente, porque la predictibilidad perfecta 
reduce por completo la notoriedad del EC. 

El modelo de Pearce y Hall también predice algunos resultados inusuales, 
Considérese, por ejemplo, el siguiente experimento de supresión condicionada. 
Durante la fase primera los sujetos reciben un condicionamiento en el que un EC 
auditivo se empareja con un El de una descarga eléctrica débil. Después, en la fase 
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segunda, reciben la presentación emparejada de un EC del mismo tono y un El de 
descarga eléctrica fuerte. ¿De qué forma el condicionamiento del tono con una 
descarga débil afectará a la capacidad del tono para condicionarse en la fase 
segunda? El modelo de Pearce-Hall predice que el entrenamiento con una des- 
carga débil altera el condicionamiento del tomo con una descarga fuerte. El 
modelo supone que la notoriedad del EC se reduce si ese EC va seguido de un El 
que se había previsto. La descarga débil se habrá hecho totalmente predecible 
durante la fase primera del entrenamiento. La predictibilidad del El durante la 
fase primera reducirá la notoriedad del EC auditivo, y eso impedirá el condicio- 
namiento del tono cuando se empareje con una descarga más fuerte en la fase 
segunda. Los resultados experimentales confirman esta predicción (Hall y Pear- 
ce, 1979), 

Los modelos de modificación del EC difieren de los modelos de reducción del 
El, no sólo en el énfasis que ponen en los cambios en la notoriedad del EC, sino 
también en que consideran que la sorpresividad del El en un ensayo determinado 
sólo ejerce un efecto sobre lo que ocurre en el ensayo siguiente. Si el ensayo diez, 
por ejemplo, acaba con un El sorprendente, ese resultado aumenta la notoriedad 
del EC en el ensayo siguiente, el once. Se supone que la sorpresividad del El en el 
ensayo diez no determina lo que se aprende en el ensayo diez. La cantidad de 
atención que el EC atrae en el ensayo diez ha venido determinada por hechos 
anteriores al ensayo diez. Así pues, la sorpresividad tiene sólo una influencia 
prospectiva sobre el condicionamiento. Esto contrasta con los modelos de reduc- 
ción del El, en los que la sorpresividad del El determina lo que se aprende en el 
mismo ensayo en que se presenta el El. La suposición de que el El de un ensayo 
determinado tiene influencia sólo en lo que se aprende en el ensayo siguiente ha 
permitido que los modelos de reducción del EC expliquen ciertos resultados espe- 
ciales (por ejemplo, Mackintosh, Bygrave y Picton, 1977), pero ha hecho que le 
resulte difícil a estos modelos explicar otros hallazgos (por ejemplo, Balaz, Kas- 
prow y Miller, 1982; Dickinson, Nicholas y Mackintosh, 1983). Ni las teorías de 
la reducción del El ni las de la reducción del EC han sido capaces de explicar todos 

_los resultados experimentales, lo cual sugiere que lor dos procesos pueden estar 


implicados en el condicionamiento clásico. 


COMENTARIOS FINALES 


Tradicionalmente, el condicionamiento clásico se ha considerado como un 
aprendizaje relativamente simple y primitivo que interviene sólo en la regulación 
de las respuestas glandulares y vasculares, como la salivación. Se suponía que el 
establecimiento de asociaciones EC-El tenía lugar casí automáticamente con el 
emparejamiento de un EC y un El. Dado que el condicionamiento era de natura- 
leza simple y automática, y que estaba limitado a respuestas viscerales y glandula- 
res, no se consideró importante para explicar la complejidad y riqueza de la con- 
ducta humana. Esta concepción del condicionamiento clásico ya no se puede 
sostener. , 

Las investigaciones revisadas en los capítulos 3 y 4han mostrado que el con- 
dicionamiento clásico es un proceso más bien complejo y que interviene en el 
condicionamiento de una gran cantidad de respuestas, entre las que se incluyen no 
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sólo las respuestas de secreción glandular, sino también la conducta emocional y 
los movimientos locomotores. El aprendizaje no se produce automáticamente por 
el hecho de emparejar un EC con un El, sino que depende de la experiencia 
previa del sujeto con cada uno de esos estímulos, de la presencia de otros estímu- 
los durante el ensayo de condicionamiento, y de hasta qué punto el EC y el El son 
relevantes entre sí. Además, el proceso de condicionamiento clásico no se limita a 
los emparejamientos EC-El. Las asociaciones aprendidas pueden darse entre dos 
estímulos biológicamente débiles (precondicionamiento sensorial), en ausencia de 
un estímulo incondicionado (condicionamiento de orden superior), o en ausencia 
de estímulos condicionados convencionales (contracondicionamiento). 

Admitidas esas y otras complejidades en los procesos de condicionamiento 
clásico, es un error no prestar atención al condicionamiento clásico a la hora de 
explicar las formas complejas de la conducta. La riqueza de los mecanismos del 
condicionamiento clásico los hace putencialmente relevantes para la riqueza y 
complejidad de la experiencia E los últimos veinte años se han produ- 
cido avances tremendos en la comprensión de los procesos del condicionamiento 
clásico. Será interesante véase de qué forma se utiliza este nuevo conocimiento 
para el análisis de formas complejas de conducta humana y animal. 





Capítulo 5 
EL CONDICIONAMIENTO INSTRUMENTAL: 
FUNDAMENTOS 


En el capítulo 5 vamos a comenzar una discusión sobre el condicionamiento 
instrumental y la conducta dirigida a una meta. En esta modalidad de condicio- 
namiento, la aparición del estímulo depende de la previa presentación de respues- 
tas específicas. En primer lugar vamos a describir los orígenes de la investigación 


sobre condicionamiento instrumental y después estudiaremos los métodos utiliza- . 


dos en la investigación contemporánea. Á continuación vamos a describir cuatro 
clases de procedimientos básicos en el condicionamiento instrumental. El capítulo 
termina con una discusión acerca de tres elementos fundamentales del paradigma 
del condicionamiento instrumental: la respuesta instrumental, la meta y la rela- 
ción entre la respuesta instrumental y la meta. 


PRIMERAS INVESTIGACIONES SOBRE CONDICIONAMIENTO INS- 
TRUMENTAL 
ENFOQUES MODERNOS DEL ESTUDIO DEL CONDICIONAMIENTO INS- 
TRUMENTAL 
Métodos de ensayos discretos 
Métodos de operante libre 
La tasa de respuestas como medida de la conducta operante 
El registrador acumulativo 
La técnica de la línea de base conductual : 
PROCEDIMIENTOS DE CONDICIONAMIENTO INSTRUMENTAL 
El reforzamiento positivo 
El castigo 
El reforzamiento negativo 
El entrenamiento de omisión 
Nota final sobre la terminología 
ELEMENTOS FUNDAMENTALES DEL CONDICIONAMIENTO INSTRU- 
MENTAL 
La respuesta instrumental 
Los límites de la respuesta en el condicionamiento instrumental 
Análisis experimental de los límites de la respuesta en el condiciona- 
miento instrumental 
Comentario final sobre las limitaciones. de la respuesta 
El reforzador instrumental 
Cantidad y calidad del reforzador 


Cambios en la cantidad y calidad del reforzador 
La relación respuesta-reforzador 
Los efectos de la contigiiidad temporal 
La contingencia respuesta-reforzador 
La detección de la causalidad 
Los efectos de la capacidad de control de los reforzadores 


COMENTARIOS FINALES 





En los capítulos precedentes discutimos varios aspectos sobre la forma en que 
los estímulos discretos provocan las respuestas. Todos los estudios sobre habitua- 
ción, sensibilización y condicionamiento clásico se refieren fundamentalmente al 
análisis de los mecanismos por los cuales los estímulos ponen en funcionamiento 
las respuestas. Á causa de este énfasis, los experimentos sobre habituación, sensi- 
bilización y condicionamiento clásico utilizan procedimientos en los que los ani- 
males no tienen control sobre los estímulos a los que están expuestos. Ciertos 
hechos, como los ECs y los Els, se introducen periódicamente en la situación 
según una pauta determinada por el experimentador. 

Los procedimientos para estudiar y modificar la conducta elicitada imitan 
muchas situaciones de la vida de los animales y las personas. Se presentan multi- 
tud de ocasiones en las que un organismo no tiene ningún control de los aconte- 
cimientos o estímulos con los que se enfrenta. Sin embargo, existen también 
muchas circunstancias en las que los hechos son un resultado directo de la con- 
ducta del individuo. Estudiando mucho, un estudiante puede aprender adecuada- 
mente una asignatura y sacar buena nota; metiendo la llave en el coche, un con- 
ductor puede poner en marcha el motor; introduciendo una moneda en una 
máquina de dulces, un niño puede conseguir un caramelo. En todos estos ejem- 
plos, algún aspecto de la conducta del sujeto sirve de instrumento para provocar 
la aparición de un estímulo consecutivo. Además, una conducta se desarrolla por 
las consecuencias que produce. Los estudiantes no estudiarían si el estudiar no 
diera como resultado el aprendizaje de una información interesante o la obtención 
de buenas notas; los conductores no meterían la llave de arranque si el coche no 
se pusiera en marcha; y los niños no introducirían monedas en la máquina si no 
consiguieran algo a cambto. Las respuestas que tienen lugar. principalmente por- 
que sirven de instrumento para. producir ciertas consecuencias se llaman .con- 
"ducta instrumental, 

Dado que la conducta, instrumental está gobernada principalmente por los 

hechos que produce, se la puede considerar como dirigida a una meta, Las res- 
puestas instrumentales se realizan porque la meta no se alcanzaría sin ellas. La 
conducta dirigida a una meta supone una gran proporción de toda la conducta 
animal y humana. Considérese la rutina de la mañana: nos levantamos para ir al 
cuarto de baño y asearnos. Nos aseamos con el fin de prepararnos para vestirnos. 
Nos vestimos para abrigarnos y para estar presentables. Desayunamos para 
suprimir el hambre. Algunas personás conducen después su coche para ir a traba- 
jar. En el trabajo realizamos varias tareas para recibir elogios y un salario. La vida 
diaria está llena de grandes y pequeñas acciones que se realizan para producir 
ciertas consecuencias. 

Es un hecho obvio para cualquiera que las consecuencias de una acción pueden 
determinar la futura repetición de esa acción. Si nos encontramos por casualidad 

un billete de mil pesetas al pasear mirando el suelo, seguiremos mirando el suelo. 
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No siempre es tan evidente la forma en que las consecuencias influyen en la 
conducta futura. Una gran parte de lo que resta del libro se dedica a la discusión 
de los mecanismos responsables del control de la conducta por sus consecuencias. 
En el presente capítulo vamos a describir las técnicas básicas, los procedimientos, 
los problemas y parte de la historia del análisis experimental de la conducta ins- 
trumental, o conducta dirigida a una meta. 

¿Cómo se puede investigar la conducta instrumental? Una forma podría ser la 
de observar el ambiente natural y buscar ejemplos de conducta dirigida a una 
meta. Sin embargo, este enfoque no es probable que lleve a resultados definitivos, 
porque los factores responsables de la conducta dirigida a una meta son difíciles 
de aislar sin una manipulación experimental. Considérese, por ejemplo, un perro 
sentado cómodamente en el jardín de la casa donde vive. Cuando una persona 
extraña se acerca, el perro comienza a ladrar fuerte, con lo que el intruso se 
marcha. Dado que los ladridos del perro tienen una consecuencia clara (la retirada 
del intruso), podemos concluir que el perro ladra para producir esta consecuencia: 
los ladridos van dirigidos a una meta. Sin embargo, otra posibilidad igualmente 
probable es que.los ladridos estuvieran suscitados por la novedad del intruso y 
persistieran mientras el estimulo elicitante estuvo presente. La consecuencia de la 
respuesta (la retirada del intruso) pudiera haber sido incidental para los ladridos 
del perro. Decidir entre esas dos alternativas es muy difícil sin manipulaciones 
experimentales de la relación entre los ladridos y sus consecuencias. 

El tipo de investigación que vamos a discutir introduce la conducta instrumen- 
tal dentro del laboratorio. La idea, como sucedía con las conductas elicitadas, es 
estudiar las respuestas instrumentales representativas, con la esperanza de descu- 
brir principios generales. Sin embargo, como veremos, existen numerosos facto- 
res que complican tal tarea. 

La conducta elicitada es relativamente simple de provocar con fines experi- 


mentales. Lo único que hay que hacer es seleccionar un estímulo que provoque 


una respuesta que nos interese. Conseguir que se produzca una respuesta instru- 
mental para poder investigarla puede resultar considerablemente más difícil, ya 
que el fin que motiva la conducta sólo es obvio una vez que la respuesta se ha 
ejecutado. El experimentador, por lo tanto, tiene primero que inducir al orga 
nismo a que dé la respuesta, de forma que se produzcan las consecuencias de la 
conducta, y conseguir el control de las futuras apariciones de la respuesta. En este 
sentido la conducta instrumental es voluntaria, o, como Skinner (1953) sugiere, es 
emitida más que elicitada. Podemos hacer varias cosas para aumentar o disminuir 
la probabilidad de que se produzca la respuesta. Sin embargo, la iniciativa, en 
último término, la tiene el organismo. Dado que la conducta instrumental se 
emite, es necesario que en las investigaciones de laboratorio se creen situaciones 
en las que la conducta tenga probabilidades de aparecer. 


PRIMERAS INVESTIGACIONES SOBRE CONDICIONAMIENTO 
INSTRUMENTAL 


Los análisis teóricos y de laboratorio sobre condicionamiento instrumental 
tuvieron sus comienzos con el trabajo de E. L Thorndike. El intento original de 
Thórndike fue- estudiar la inteligencia animal (Thorndike, 1898). La publicación 


mu 
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de la teoría de la evolución de Darwin llevó a que muchas personas se pregunta- 
ran hasta qué punto las capacidades intelectuales humanas, como el razona- 
miento, están presentes en los animales. (Como veremos en el capítulo 12, esas 
mismas cuestiones continúan suseitando interés en los investigadores contempo- 


ráneos.) Thorndike investigó la inteligencia. animal ideando una serie de cajas: .... 


problema. Metía un gato hambriento (podía ser también un perro o un pollo) en 
"Ta taja-problema y les colocaba comida fuera, a la vista. La tarea del gato consistía 
en aprender a escapar de la caja para obtener la comida. 

Las diferentes cajas- problema requerían del gato diferentes respuestas para 
salir. Algunas eran más fáciles que otras. En las cajas más simples, los movimien- 
tos aleatorios del gato le llevaban a escapar y a acceder a la comida. Conforme se 
repetían los ensayos, el gato escapaba cada vez más deprisa. En cajas más compli- 
cadas, como la caja K que se muestra en la figura 5.1, el escapar mejoraba con la 
práctica, pero más lentamente. En la caja K el gato, para escapar, tenfa que tirar 
de una cuerda, presionar un pedal y abrir uno de los dos picaportes. La figura 5.1 
muestra los tiempos medios que tardaban en escapar cinco gatos distintos. En el 
primer ensayo, ninguno de los gatos escapó en los diez minutos de tiempo 
máximo permitido. La actuación de los gatos mejoró en los últimos ensayos; cerca 
del final del experimento escapaban en dos o tres minutos. 

Thorndike interpretó que los resultados de sus estudios reflejaban el aprendi- 
zaje de una asociación. Cuando se colocaba por primera vez un gato en una caja, 
desplegaba toda una variedad de respuestas típicas de un animal confinado. Even- 
tualmente, algunas de esas respuestas producían la apertura de la puerta. Thorn- 
dike pensó que el lograr escapar llevaba al aprendizaje de una asociación entre los 
estímulos del interior de la caja-problema y las respuestas de escape, Cuando. la 
asociación, o conexión, entre la caja y las respuestas con éxito se fortalecía, el gato 
daba esas respuestas en cuanto se le encerraba en la caja-problema, Las conse- 


Cuencias de las respuestas con éxito (el escapar de la caja) fortalecían la asociación. 


entre los estímulos de la caja y esas respuestas. 
Sobre la base de su investigación, Thordik formuló la ley del efecto. La ley 


APARTADO 5.1. Edward Lee Thorndike 


Thorndike nació en 1874 y murió en 1949. Antes de su graduación en la Universidad 
de Wesleyan se interesó por el trabajo de Willian James, por entonces en Harvard. 
Thorndike ingresó como estudiante graduado en Harvard en 1895. Durante su estancia allí 
inició sus investigaciones sobre conducta instrumental. Comenzó utilizando polluelos como 
sujetos. Ya que en ese momento no existía en Harvard espacio para un laboratorio, lo 
montó en el sótano de William James. Al poco tiempo le ofrecieron una beca en la Uni- 
versidad de Columbia. Esta vez situó su laboratorio en el ático de James Cattell. Thorndike 
recibió el doctorado en Columbia por un trabajo titulado «Inteligencia animal: un análisis 
experimental de los procesos asociativos en los animales». Este contenía sus famosos 
experimentos con cajas-problema. Thorndike permaneció en Nueva York, en el Cotumbia 
University Teachers College, donde ejerció como profesor de psicología educativa muchos 
años. Entre otras cosas, intentó aplicar a los niños los principios del aprendizaje por 
ensayo y error que había descubierto en los animales. Se interesó también en los tests 
psicológicos y llegó a ser una autoridad en este campo de reciente creación. Varios años 
antes de su muerte volvió a Harvard como agregado de William James, un merecido honor 
para este gran psicólogo. 
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NOA 


Tiempo de escape (seg.) 


4 8 12 16 20 24 28 32 36 40 
Ensayos 





Figura 5.1.—La caja- problema K de Thorndike y los tiempos medios de escape de cinco Batos someti- 
dos a 40 ensayos sucesivos en la caja. Con la práctica, a los gatos cada vez les lleva menos tiempo salir 
de la caja. (Según 'Thorndike, 1898, e Imada e Imada, 1983.) 


del efecto establece que gsi una respuesta ejecutada en presencia de un estímulo . 
va seguida de un hecho satisfactorio, la asociación entre el estímulo y la. respuesta 
se fortalece, “Si la respuesta va, seguida de un hecho molesto, la asociación se 
debilita». Es Importante recalcar aquí que, de acuerdo con la ley del efecto, los 
“animales aprenden una asociación entre la respuesta y los estímulos presentes en 
el momento de la respuesta. La consecuencia de la respuesta no está implicada en 
la asociación. La consecuencia, satisfactoria o molesta, simplemente sirve para 
fortalecer o debilitar el lazo, o asociación, entre la prspucse y la situación 
estimular. 


ENFOQUES MODERNOS DEL ESTUDIO DEL CONDICIONAMIENTO 
INSTRUMENTAL 


Thorndike utilizó quince cajas-problema distintas en sus investigaciones, cada 
una de las cuales requería manipulaciones diferentes para que el gato saliera. 
Conforme crecía el interés de los científicos por el estudio del aprendizaje con 
sujeros animales, la variedad de situaciones que se investigaban se hizo mucho 
más pequeña. Ciertas situaciones experimentales se volvieron «estándar» y se han 
utilizado repetidamente para facilitar la comparación de los resultados obtenidos 
en diferentes laboratorios. Algunas técnicas contemporáneas corrientes en el 
estudio de la conducta instrumental son similares a los procedimientos de Thorn- 
dike en el sentido de que contienen ensayos discretos: se coloca a los sujetos 
repetidamente en un aparato y solamente pueden realizar la respuesta instrumen- 
tal una vez en cada colocación. Por el contrario, en otros experimentos se emplea 
el método de operante libre, en el cual la respuesta puede efectuarse repetida- 
mente (libremente) una vez que se ha colocado al sujeto en la cámara ex- 
perimental. 
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Métodos de ensayos discretos 


Las investigaciones de ensayos discretos acerca del condicionamiento instru- 
mental a menudo se llevan a cabo con algún tipo de laberinto. El uso de laberin- 
tos en las investigaciones de aprendizaje fue introducido en los umbrales del 
siglo XX (1899, 1900) por Smail, un psicólogo americano. Small se interesó por el 
estudio de las ratas y se decidió a utilizar un laberinto por un artículo que leyó en 
el Scientific American en el que se describía el complejo sistema de madrigueras 
que las ratas canguro construyen normalmente de forma natural. Small hacía el 
razonamiento de que usando laberintos se aprovechaba «la propensión de las 
ratas a los pasadizos sInuosos». 

La figura 5.2 muestra dos laberintos que se utilizan frecuentemente en la 
investigación contemporánea. El corredor, o callejón recto, contiene una caja de 
salida en un extremo y una caja de meta en el otro. La rata se coloca en la caja de 
salida al principio de cada ensayo. Entonces se levanta la barrera movible que 
separa la caja de salida de la sección principal del corredor, y se deja a la rata 
correr por el corredor hasta que alcanza la caja de meta, que normalmente con- 
tiene un premio, como comida o agua. 

El progreso de la conducta instrumental se suele evaluar utilizando una 


Barrera 
abatible 





Figrra 5.2.-—Vista superior de un corredor y de un laberinto en T. S es la caja de salida, M, la caja de 
meta. 
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medida de la fuerza de respuesta. Por ejemplo, podemos medir cuánto tiempo 
tarda el animal en recorrer el callejón y alcanzar la caja de meta. Esto se llama 
tiempo del recorrido. Con la repetición de los ensayos los animales van necesi- 
tando progresivamente menos tiempo para alcanzar la caja de meta. Algunos 
experimentadores prefieren medir la velocidad a la que el animal recorre el calle- 
jón. El tiempo del recorrido se puede convertir fácilmente en velocidad del reco- 
rrido dividiendo la longitud del recorrido por el tiempo de recorrido. Otra medida 
común de conducta en los callejones y laberintos en T es la latencia de la res- 
puesta de carrera. La latencia es el tiempo que tarda el animal en abandonar la 
caja de salida y empezar a moverse por el corredor. Es característico que las 
latencias se acorten conforme progresa el entrenamiento. 

Otro laberinto utilizado con frecuencia es el laberinto en T, que se muestra en 
el lado derecho de la figura 5.2. El laberinto en T consiste en una caja de salida y 
callejones que forman una T. Se coloca una caja de meta al final de cada brazo de 
la T. Dado que tiene dos cajas de meta, el laberinto en Tes adecuado para estu- 
díiar la conducta de «elección» instrumental. Por ejemplo, el experimentador 


puede poner un cebo con comida natural en una caja de meta y en la otra caja! 


comida sazomada com Nutrasweet (un edulcorante artificial). Colocando varias 
veces la rata en el laberinto en T y viendo qué brazo escoge, el experimentador 
puede medir la preferencia por una u otra comida. La latencia y¡velocidad del 
recorrido por el tronco de la T hasta los brazos también nos proprociona una 
información importante. Si ninguna de las dos alternativas que se lelsuministran 
en las cajas de meta es apetitosa, la rata puede tener una latencia larga para 
iniciar el recorrido en el laberinto y puede que ande despacio. 


Métodos de operante libre 


En un corredor o en un laberinto en T, un sujeto tiene limitadas sus oportuni- 
dades de responder. Después de que el sujeto alcanza la caja de meta, se le saca un 
rato antes de volverlo a meter en la caja de salida para otro ensayo. Por el contra- 
rio, los métodos de operante libre permiten al sujeto repetir «libremente» la 
respuesta instrumental una y otra vez. Los métodos de operante libre fueron 
ideados por B. F. Skinner (1938) para estudiar la conducta de una manera más 
continua de la que es posible con los laberintos. Skinner se interesó por el análisis 
de laboratorio de una forma de conducta que fuera representativa de toda la acti- 
vidad que se produce continuamente de forma natural. Sin embargo, antes de que 
pueda ser analizada experimentalmente una conducta, se tiene que definir una 
unidad medible de la conducta. Las observaciones comunes de la conducta indican 
que la conducta es continua. Una actividad lleva a otra. La conducta no se divide 
en unidades como las moléculas de una preparación química. Skinner propuso el 
concepto de operante como forma de dividir la conducta en unidades significati- 
vas y medibles. | 

La figura 5.3 muestra una caja de Skinner típica que se utiliza para estudiar la 
conducta de operante libre en las ratas (en la figura 1.1 se presenta una caja de 
Skinner utilizada para estudiar el picoteo en las palomas). La caja de Skinner es 
una caja experimental pequeña que contiene una especie de palanca que la rata 
puede manipular. La cámara también posee un mecanismo que suministra un 
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Figura 5.3.—Una caja de Skin- 
ner equipada con una palanca de 
respuesta y un dispositivo auto- 
mático de expedición de comida, 
El equipamiento eléctrico sirve 
para programar procedimientos 
y tegistrar automáticamente las 
respuestas. 





premio, como comida o agua. En el experimento más simple se coloca una rata 
hambrienta en la cámara. La palanca se conecta electrónicamente al sistema de 
suministro de comida. Cuando la rata presiona la palanca, cae una bola de comida 
en un cuenco. 

Las respuestas operantes como la de presión de la palanca se definen en tér- 
minos del efecto que tienen sobre el ambiente. Las actividades que ejercen el 
mismo efecto sobre el ambiente se consideran ejemplos del mismo operante. El 
hecho esencial no son los músculos que intervengan en la conducta, sino la forma 
en que la conducta «opera» sobre el ambiente. Por ejemplo, la respuesta operante 
de presión de la palanca en las ratas se define típicamente como el descenso de la 
palanca que se precisa para causar el cierre del microinterruptor. El sujeto puede 
presionar la palanca con su pata delantera derecha, con la izquierda o con el rabo. 
Todas esas diferentes respuestas musculares constituyen el mismo operante si 
todas presionan la palanca hasta abajo. Se supone que las distintas formas de 
presionar la palanca son funcionalmente equivalentes porque todas tienen el 
mismo efecto sobre el ambiente: cerrar el microinterruptor. 

La mayoría de las ratas, cuando son colocadas en una caja de Skinner, no 
presionan casi nunca la palanca, Existen dos pasos preliminares para el estable- 
cimiento de la conducta de presión de la palanca. Se enseña primero a los anima- 
les el momento en que la comida está disponible en el cuenco. Esto se realiza 
emparejando repetidamente el sonido del aparato de suministrar la comida con el 
suministro de una bolita de comida en el cuenco. Después de suficientes empare- 
jamientos de este tipo, el sonido del suministro de comida hace de estímulo con- 
dicionado para la presencia de comida en el cuenco. Esta fase preliminar del 
condicionamiento se llama entrenamiento al comedero. 

Después del entrenamiento al comedero, el sujeto está preparado para apren- 
der la respuesta instrumental requerida. La mayoría de las respuestas instrumen- 
tales se pueden analizar en términos de sus componentes. Por ejemplo, para 
presionar la palanca es necesario que el sujeto se acerque a la palanca, levante las 
patas delanteras por encima de la palanca y empuje hacia abajo. Para facilitar la 
presión de la palanca, el experimentador puede comenzar dando comida al sujeto 
cuando éste realiza los componentes preliminares de la respuesta de presión de la 


palanca. En un principio se le puede reforzar al sujeto sólo por el hecho de 
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aproximarse a la palanca, Después se le puede entregar el premio sólo sí el sujeto 
huele o toca la palanca. Por último, se le puede entregar el premio sólo si el 
animal presiona realmente la palanca. La secuencia de pasos del entrenamiento se 
llama moldeamiento por aproximaciones sucesivas. Ántes de entregar el pre- 
mio el experimentador va pidiendo cada vez un acercamiento mayor a la conducta 


deseada. 


La tasa de respuestas como medida de la conducta operante. La ventaja 
mayor que poseen los métodos de operante libre sobre las técnicas de ensayos 
discretos para el estudio de la conducta instrumental es que los métodos de ope- 
rante libre permiten una observación continua de la conducta durante largos 
períodos de tiempo. Al tener continuas oportunidades para responder, es el 
sujeto, más que el experimentador, el que determina la frecuencia de aparición de 
la respuesta instrumental. Por tanto, las técnicas de operante libre proporcionan 
una oportunidad para observar los cambios en la probabilidad de la conducta a lo 
largo del tiempo. ¿De qué forma deberíamos aprovecharnos de esto y medir la 
probabilidad de una respuesta operante? Las medidas de la latencia y la velocidad 
de la respuesta que se usan normalmente en los procedimientos de ensayos dis- 
cretos nos suministran una información detallada acerca de las respuestas indivi- 
duales, pero no determinan la probabilidad de repetición de la respuesta. Skinner 
propuso que la tasa de aparición de la conducta operante (la frecuencia de la 
respuesta en un intervalo concreto) se utilizara como medida de probabilidad de 
la respuesta. Si la tasa de respuestas es alta, se dice que la probabilidad de la 
respuesta es alta. Si la tasa de respuestas es baja, se dice que la probabilidad de la 


respuesta es baja. 


El registrador acumulativo. Es habttual sas investigaciones de operante 
libre se centren en la medición de la tasa de conducta a lo largo del tiempo) 
Skinner ideó un instrumento de registro de datos, el registrador acumulativo, 
que es sumamente adecuado para registrar y presentar la información. La 
figura 5.4 es el dibujo de un registrador acumulativo. El registrador acumulativo 
consiste en un tambor rotatorio que saca el papel del registrador a una velocidad 





: APARTADO 5.2. La definición de las respuestas en la terapia de conducta 


El concepto del operante es útil para definir las conductas, tanto en la clínica como en 
el laboratorio. Una madre lleva a su hijo a la clínica quejándose de que es hiperactivo o 
indisciplinado, Describe a su hijo con comentarios tales como «hace estragos cada vez que 
entra en una habitación», o «me vuelve loca», o «no hay quien lo controle». Del mismo 
modo, un matrimonio puede buscar ayuda porque siente que ha desaparecido su amor. 
Tanto la madre como la pareja de casados describe su problema en términos generales, 
aunque la dificultad provenga de una serie de respuestas específicas. El tratamiento en 
muchos casos debe comenzar con una definición más precisa de las actividades problemáti- 
cas. ¿Qué hace ese niño, en realidad, cuando entra en una habitación? ¿Qué respuestas 
específicas llevan al marido y a la esposa a la conclusión de que su amor está acabado? En 
ocasiones, el hecho de definir las respuestas especificas del problema es suficiente para 
aliviar la dificultad. Otras veces, el clínico tiene que ayudar a los pacientes a averiguar qué 
clase de hechos o de situaciones promueven las respuestas problemáticas. Entonces puede 
ser posible cambiar el ambiente, de forma que fomente respuestas más adecuadas que 
sustituyan a las actividades problemáticas. 
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Figura 5.4. —Registrador acumnu- 
lativo usado para el registro con- 
tinuo de la conducta. El papel 
sale de la máquina hacia la iz- 
quierda con una velocidad cons- 
tante. Cada respuesta hace que la 
plumilla suba un paso en el pa- 
pel, Encre los puntos Á y B no 
se presentaron respuestas. Entre 
los puntos B y C aparece una 
moderada tasa de respuesta, asa 
que se hace más elevada entre 
los puntos € y D. 


o l el 
constante. Un lápiz descansa en la superficie del pape! Si no se dan o papel 
ápl j línea horizontal a medida que sale 
lápiz permanece quieto y marca una ! o 
de la máquina. Si el animal realiza una respuesta de presión de la palanca, el me 
se mueve un paso verticalmente en el papel. Ya que o . Po Sa 
4piz se mueva hacia arriba. un , 
la palanca da lugar a que el lápiz s a as 
api j o (total) de res 
representa el número acumu 
vertical total que recorre el lápiz a ad 
registrador a una 
eto. Dado que el papel sale de 
uestas que ha realizado el suje y : una 
Velocidad constante, la distancia horizontal en el registro acumulativo es 


% - , e ada pOr 
medida de! tiempo transcurrido en la sesión. La pendiente de la línea dibujada po | 
el registrador acumulativo representa la tasa de respuestas. 


El registro acumulativo proporciona una representación visual completa de 


cuándo y con qué frecuencia responde el animal durante la sesión. En el registro 
ecu 
í la figura 5.4, por ejemplo, el animal no €) 
acumulativo que se muestra en , a tas 
¡ tos A y B. Se daba una tasa lenta p 

ninguna respuesta entre los pun 

entre los DUtOS B y C. Las respuestas aparecen más frecuentemente entre los 
puntos C y D, y el animal dejaba de responder después del punto D. 


j -N UNA 
La técnica de la línea de base conductual. Cuando se mete un eN o n 0 
caja de Skinñer, éste despliega una amplia variedad de actividades. ada acti : 
posee úna tasa concreta de aparición antes del condicionamiento. Ona pa pueva, 
e respues- 
de respuestas de oler y una tasa baja 
or ejemplo, posee una alta tasa pue pues- 
tas de presión de la palanca. Esta tasa inicial de respuestas, antes de que se o 
Í i 1 tal se llama línea de base del operan . 
duzca una manipulación experimental, Da, 
Í uede usarse para valorar el cam 
La línea de base del operante libre p ra m on 
ducta que tiene lugar cuando se introduce un procedimiento de condiciones o 
El reforzamiento de la presión de la palanca, por ejemplo, RAN a as 
í rante bajo hasta una tasa mucho ! , 
esta respuesta desde un nivel oper ch 
La línea de base del operante libre, o nivel del operante, es útil para novelas 
los efectos de procedimientos como el reforzamiento, que aumentan». a asa o 
respuesta. Sin embargo, si el nivel operante de una respuesta es bajo a mperer, 
utili ¡ experime 
tar los efectos de las manipulaciones 
no puede utilizarse para detec ' e 
Í és disminul tasa de la conducra. En tales ca 
ue podrían después disminuir la e 
niente reforzar de forma regular la respuesta operante para me se Dro que 
A 1 nivel operante. Este nivel de respues 
con una tasa estable más alta que € nte. | me 
se mantiene mediante el refuerzo se llama también línea de base. La tasa e lnea 
de base de una respuesta Operante reforzada puede utilizarse para eva aos 
efectos de aquellos procedimientos, estímulos u otras manipulaciones que pue 





172 MICHAEL DOMJAN Y BARBARA BURKHARD 


Descarga 


y 


Respuestas ———+» 





Figura 5.5.—Registro acumulativo que muestra los efectos del adiestramiento de una respuesta emo- 
cional condicionada. Los sujetos reciben una breve descarga al final de la presentación del EC y, 
consecuentemente, suprimen su respuesta de apretar la palanca durante el EC. (Datos hipotéticos.) 


aumentar o disminuir la tasa de la conducta operante. Los efectos de las manipu- 
laciones experimentales se revelan a través de los cambios en la línea de base de 
la respuesta operante. 

En el capítulo 3 describimos el uso de la línea de base conductual para eva- 
luar los efectos de los procedimientos de condicionamiento clásico aversivo. La 
técnica, conocida como supresión condicionada o procedimiento de respuesta 
emocional condicionada, implica en primer lugar conseguir que las ratas presio- 
nen a un ritmo estable la palanca con la que obtienen un reforzamiento de 
comida. Un EC luminoso o auditivo se empareja después con una descarga eléc- 
trica. Los efectos de este condicionamiento clásico se evalúan después presentando 
el estímulo condicionado mientras el sujeto presiona la palanca. Como se puede 
ver en la figura 5.5, el animal deja de presionar la palanca cuando se presenta el 


EC. Durante la presentación del EC él registro acumulativo es plano. Antes y 


después de la presentación del EC el animal presiona la palanca a un ritmo esta- 
ble. Así pues, los efectos del procedimiento de condicionamiento clásico son cla- 
ramente evidentes cuando existe un cambio en la tasa de línea de base de la 
conducta operante. 

La técnica de la línea de base conductual popularizada por Skinner y sus estu- 
diantes ofrece un método nuevo para el análisis de la conducta, porque/ permite 
una evaluación de los efectos de una manipulación experimental sobre la tonducta 
de sujetos individuales )(véase Sidman, 1960). Hasta que se desarrolló la técnica de 
la línea de base conductual, los estudios de aprendizaje-se caracterizaban por 
investigar grupos grandes de sujetos expuestos a diferentes condiciones experi- 
mentales. Los efectos de esas condiciones se evaluaban después, comparando la 
actuación de los sujetos en los distintos grupos. Los resultados se basaban en la 
actuación media de los grupos de sujeros. Skinner puso objeciones a este enfoque 
estadístico grupal y recomendó exponer a sujetos individuales al mismo procedi- 
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miento-de refuerzo hasta que la conducta fuera estable y predecible. Observó 
después la forma en que una manipulación influía en la línea de base Pa En 
tanto que la línea de base fuera efectivamente estable, los resultados de a E 
pulación experimental podían observarse fácilmente. Dado que pueden estable- 
cerse líneas de base estables, Skinner sostuvo que los grupos grandes de sujetos 
eran innecesarios en investigación conductual. Los efectos de las A 
experimentales deberían ser evidentes en los sujetos ce A 
expuesto, tanto el enfoque estadístico grupal como el del sujeto individual $0n 
utilizados para el análisis experimental de la conducta. Algunas cuestiones se res- 
ponden más fácilmente utilizando una técnica de línea de base de sujeto E 
Otros tipos de cuestiones requieren el uso de grupos de sujetos. Á lo sr e lo 
que resta del libro, iremos discutiendo ambas modalidades de investigación. 


PROCEDIMIENTOS DE CONDICIONAMIENTO INSTRUMENTAL 


En todas las situaciones de condicionamiento. instrumental, la conducta del 


sujeto produce algún tipo de consecuencia en el ambiente. Los procedimientos de 


condicionamiento instrumental pueden clasificarse según la naturaleza del aconte- 


cimiento ambiental controlado por la conducta. El acontecimiento puede ser agra- | 


dable o desagradable. Un acontecimiento agradable se llama estímulo apetltivo. 
Da acontecimiento desagradable se llama estímulo aversivo. Otro factor po 
éánté en la clasificación de los procedimientos de condicionamiento rc 
es la relación, o contingencia, entre la respuesta y el acontecimiento ambienta 

que controla. La respuesta instrumental puede producir el acontecimiento (en 
cuyo caso se dice que tiene lugar una contingencia positiva),O eliminarlo e E 
caso se dice que tiene lugar una contingencia negativa). La tabla 5.1 ei € 
cuatro procedimientos comunes de condicionamiento instrumental. Los procedi- 
mientos difieren en el tipo de estímulo (reforzador apetítivo O aversivo) que . 
controla con la respuesta instrumental, y en si la respuesta produce O elimina e 


estímulo. 


Tabla 5.1. Los procedimientos de condicionamiento instrumental : 


Nombre del procedimiento Efecto de la respuesta instrumental 


La respuesta produce un estímulo apetitivo 
con pocas probabilidades de aparecer por 
otros medios. 


Reforzamiento positivo 


La respuesta produce un estímulo ayersivo 
con pocas probabilidades de aparecer por 
otros medios. 


Castigo 


Reforzamiento negativo (escape o evitación) La respuesta interrumpe o impide la pre- 
sentación de un estímulo aversivo que apa- 


rece frecuentemente. 


La respuesta interrumpe o impide la pre- 
sentación de un estímulo aperitivo que apa- 
rece frecuentemente. 


Entrenamiento de omisión 


174 MICHAEL DOMJAN Y BARBARA BURKHARD 


El reforzamiento postiivo 


El término, reforzamiento positixo. se refiere auna clase-de-simuaciones, en. las 
que existe una contingencia positiva entre. la. respuesta. instrumental y, un estí- 
“mulo reforzador apetitivo. En otras palabras, si el sujeto ejecuta la respuesta ins- 
trumental, recibe el estimtiio reforzador; sí el sujeto no ejecuta la respuesta, el 
estimulo reforzador no se presenta. Dar una bólita de comida a ina rata bam- 
“brienta siempre que presiona la palánca es un ejemplo de laboratório de reforza- 
miento positivo. Existen muchos ejemplos de reforzamiento positivo fuera del 
laboratorio. Un padre puede dar un dulce a su hija sólo cuando ésta deja los 
juguetes; un profesor puede alabar a un estudiante sólo cuando le presenta un 
buen trabajo; o una empleada puede recibir un cheque extra sólo cuando realiza 
bien su labor. La intención del padre, del profesor y del jefe es asegurar que la 
respuesta instrumental siga produciéndose y, quizá, que incluso aumente su 
frecuencia. 

A veces se utilizan hechos recompensantes continuos en los procedimientos 
de reforzamiento positivo. En esos casos, el acontecimiento recompensante conti- 
núa (o puede incluso aumentar) en tanto se siga ejecutando la respuesta imstru- 
mental. Si cesa la respuesta instrumental, el estímulo reforzador también cesa o 
disminuye. En una aplicación interesante de este tipo de reforzamiento positivo, 
unos niños fueron condicionados a dar patadas con el fin de hacer funcionar un 
móvil colgado encima de la cuna. (Rovee y Rovee, 1969). Cuanto más pataleaban, 
más movimientos podían producir en el móvil. Los niños, en esas circunstancias, 
mostraban un aumento rápido y sostenido de las patadas. 

Los procedimientos de laboratorio en los que se utiliza un estímulo reforzador 
continuo se asemejan a las situaciones fuera del laboratorio en las que existe una 
conexión mecánica directa entre la conducta y el ambiente. Por ejemplo, mientras 
se dé a los pedales de una bicicleta, ésta se moverá; mientras se alimente con leña 
el fuego, en un día frío de invierno, seguirá dándonos calor; mientras una niña se 
ayude del pie para que su columpio coja impulso, seguirá disfrutando del balanceo. 
Aunque en estos ejemplos están implicados reforzadores continuos, suponen, en 
cualquier caso, un reforzamiento positivo porque existe, en todos ellos, una con- 


.tingencia positiva entre la respuesta instrumental y el reforzador. En cuanto se 


terminan las respuestas instrumentales, los estímulos reforzadores se terminan 
también. 


El castigo 


El término castigo se refiere a una clase de situaciones en las que existe una 
contingencia positiva entre. la respuesta instrumental y un estímulo desagradable 
O aversivo. Si el sujeto ejecuta la respuesta instrumental, recibe el estímulo aver- 
"SivO $T nó ejecuta la respuesta instrumental, el estímulo aversivo ho se presenta. 
Una madre puede reprender a su hijo por correr por la calle, pero no por jugar 
tranquilamente en un jardín; el jefe puede criticarte por llegar tarde a una 
reunión; un profesor puede suspender a alguien porque ha contestado muchas 


preguntas mal, Esos procedimientos disminuyen la probabilidad en el futuro de la 
respuesta instrumental. 


a dl 





PRINCIPIOS DE APRENDIZAJE Y DE CONDUCTA 175 


- Los experimentos de laboratorio sobre castigo incluyen, por lo general, algún 
tipo de reforzamiento positivo para conseguir que la conducta instrumental se 
produzca de vez en cuando, En un principio, se puede entrenar a los sujetos a dar 
alguna respuesta para obtener un reforzamiento positivo, como presionar una 
palanca o correr por un pasillo por comida. Una vez que se establece la respuesta 


de la palanca se puede presentar un estímulo aversivo, como una descarga eléc- - 


trica, después de cada presión de la palanca. En el ejemplo del corredor, el sujeto 
puede recibir una breve descarga en la caja de meta. El resultado es un descenso 
en la presión de la palanca o en la velocidad de carrera. 


El reforzamiento negativo 


En las dos primeras situaciones que hemos descrito existía una contingencia 
positiva entre la respuesta instrumental y el reforzador. Si la respuesta se presen- 
taba, el reforzador se daba; si la respuesta no se presentaba, el reforzador no se 
daba. En el reforzamiento positivo, el reforzador era un estímulo provechoso o 
agradable; en el castigo, el reforzador era un estímulo aversivo o desagradable. 
Abora volvemos a los procedimientos en los que está implicada una contingencia 
negativa entre la respuesta instrumental y el reforzador. En una contingencia 
negativa, la respuesta interrumpe o impide la presentación del reforzador. Si se 
Presenta la respuesta, el reforzador se retiene; si no se presenta la respuestá se 
administra el reforzador. Ese procedimiento aumenta la probabilidad de la con 
ducta si el reforzador es un estímulo aversivo. Las situaciones en las que la apari- 
ción de una conducta instrumental interrumpe o impide la entrega de un estímulo 
aversivo se llaman procedimientos de reforzamiento negativo. 


Existen dos tipos de procedimientos de reforzamiento negativo. En un caso, el 


estímulo aversivo se presenta continuamente, pero puede ser interrumpido con la 
presentación de la respuesta instrumental. Este tipo de procedimiento se llama de 
escapez.Los. prisioneros. pueden.escapar de lo desagradable de la cárcel fugándose. 
Podemos escapar de los sonidos molestos de un aparato de radio que no emite 
bien desenchufándolo. La gente se puede marchar de un cine para escapar de una 
mala película, En el faboratorio una rata puede estar expuesta, al principio del 
ensayo, a una descarga eléctrica continua. La rata puede escapar de la descarga 
saltando por encima de una barra o presionando una palanca. En todos estos 
casos, la presencia/de un estímulo aversivo establece la ocasión para la respuesta 
inserumental, La respuesta instrumental se refuerza con la interrupción del estí- 
mulo aversivo sólo si la respuesta aparece durante la presentación del estímulo 
aversivo. Si la rata presiona la palanca cuando la descarga mo está activada, la 
respuesta de presión de la palanca no se refuerza con la interrupción de la 
descarga. 

En, el.segundo» tipo-de proceso de.reforzamiento negativo está implicado un 
estimulo.2versivo.que.s€, programa, para.ser: presentado en algún momento en el. 
futuro. En este caso, la respuesta instrumental impide.la presentación del estí- 
mulo aversivo, Este tipo de procedimiento se.llama evitación. Muchas cosas las 
realizamos. para..preverur. la aparición de algo malo. Los estudiantes, a menudo 
estudian antes de un examen para evitar una mala nota; una persona que res- 
ponde a una alarma de incendios puede evitar el quemarse. Las personas llevan 
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sus coches a revisar para evitar averías inesperadas. En eMaboratorio se puede 
programar que una rata reciba una descarga al final de un estímulo de aviso. Sin 
embargo, si ejecuta la respuesta instrumental durante el estímulo de aviso, no se 
da la descarga. En el capítulo 9 se dirán más cosas acerca de la conducta de 
evitación. 


El entrenamiento de omisión Y 


_ Otro tipo.de.entrenamiento que implica. una contingencia negativa entre la 
respuesta instrumental y, el reforzador se lama entrenamiento de omisión. En 
este caso, la respuesta instrumental impide la aparición de un hecho agradableG_ 
“relorzadar apetitivo, Si el sujeto da la respuesta instrumental no se presenta el 
reforzador apetitivo. Así pues, el reforzador se entrega sólo si el sujeto retiene la 
respuesta instrumental. Como puede suponerse, este tipo de procedimiento lleva 
a un descenso en la probabilidad de la conducta instrumental. 

El entrenamiento de omisión es el método preferido para disuadir una .con- 
ducta humana porque no conlleva la presentación de un estímulo aversivo (como 
ocurre con el cástigo). Utilizamos el entrenamiento de omisión cuando le pedi- 
mos a un niño que se vaya a su habitación después de hacer algo malo. Los padres 
no introducen un estímulo aversivo cuando le dicen al niño que se vaya a su 
cuarto. No existe nada aversivo en la habitación del niño, Más bien, al enviar al 
niño a su cuarto lo que hacen los padres es apartar las fuentes de reforzamiento 
positivo, como por ejemplo jugar con amigos o ver la televisión. El retirar el 
carnet de conducir a alguien por conducir bebido también constituye un entrena- 
miento de omisión (retirada del reforzamiento o privilegio de conducir). 

Los procedimientos de entrenamiento de omisión se llaman a veces también - 
reforzamiento diferencial de otra conducta o RDO.. Este término subraya el. 
hecho de que, en el entrenamiento de omisión, el sujeto recibe periódicamente el 
'reforzador positivo siempre que la conducta que realice seá otra que la Ttéspuesta 
especificada en el procedimiento. La realización de la conducta que se'había pre” 
visto da como resultado la omisión del premio que se habría entregado en caso de 
que el sujeto hubiera realizado alguna «otra» conducta. Así pues, el entrena-- 
miento de omisión.consiste.en el reforzamiento.de «otra» conducta. 


Nota final sobre la terminología 


Existe a menudo una gran confusión sobre los términos que se utilizan para 
describir los procedimientos de condicionamiento instrumental. Varios comenta- 
ríos pueden ayudar a clarificar el tema. En primer lugar, los términos reforza- 
miento negativo y positivo no se refieren a resultados agradables o desagradables. 
Se refieren a contingencias positivas y negativas entre la respuesta instrumental y 
su consecuencia sobre el ambiente. El reforzamiento positivo implica una contin- 
gencia positiva entre la conducta y un hecho ambiental (/a presentación de un 
estímulo provechoso), y el reforzamiento negativo implica una contingencia 
negativa entre la conducta y un acontecimiento ambiental (la retsrada de un estí- 
mulo aversivo). El término reforzamiento se utiliza en ambos casos porque tanto 
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el reforzamiento positivo como el negativo suponen un fortalecimiento (o refor- 
zamiento) de la conducta. 

Otra confusión común es la que existe entre reforzamiento negativo y castigo. 
En los dos procedimientos se utiliza un estímulo aversivo. Sin embargo, la rela- 
ción de la respuesta instrumental con el estimulo aversivo es absolutamente dife- 
rente en cada caso. En lo que se denomina comúnmente castigo, existe una con- 
eimgencia positiva entre la respuesta instrumental y el estímulo aversivo. (La 
respuesta da lugar a la presentación del estímulo aversivo.) Por el contrario, en el 
reforzamiento negativo existe una contingencia negativa respuesta/reforzador. 
(La respuesta interrumpe o impide la presentación del estímulo aversivo.) Esta 
diferencia en las contingencias produce resultados muy diferentes. La respuesta 
instrumental disminuye con el procedimiento del castigo y aumenta con el 
refuerzo negativo. 


ELEMENTOS FUNDAMENTALES DEL CONDICIONAMIENT 
INSTRUMENTAL 


Como veremos en los capítulos siguientes, el análisis del condicionamiento 
instrumental implica numerosos factores y variables. Sin embargo, la esencia de la 
conducta instrumental es que está controlada por sus consecuencias. Ási, en el 


condicionamiento instrumental intervienen tres elementos: una réspuesta, un” - 


resultado (el reforzador) y una relación, o coritingencia, entre la respuesta y el 
Teforzador. En lo que queda del capítido vamos a discutir los efectos que tiene cada 
“tiño de estos elementos fundamentales sobre el condicionamiento instrumental 


La respuesta instrumental 


El resultado de los procedimientos de condicionamiento instrumental depende 
en parte de Ja naturaleza de la respuesta que se condiciona. Algunas respuestas se 
modifican más fácilmente con ciertos procedimientos de condicionamiento ins- 
trumental que otras. En el capítulo 9 vamos a describir de qué forma influye la 
naturaleza de la respuesta en el resultado del reforzamiento negativo (evitación) y 
en los procedimientos de castigo. En la presente sección vamos a describir la 
forma en que la naturaleza de la respuesta determina los resultados de los proce- 
dimientos de reforzamiento positivo. 


Ya hemos descrito dos técnicas contemporáneas para estudiar el condiciona- : 


miento instrumental en el que intervienen diferentes tipos de respuestas. En los 
estudios de ensayos discretos en corredores, los sujetos tienen que ir por un 
corredor desde una caja de salida a una de meta con el fin de obtener el reforza- 
dor. En esos experimentos los sujetos no tienen que aprender la respuesta impli- 
cada en la tarea, la locomoción. Los animales que se utilizan en esos experimentos 
son lo suficientemente mayores para saber andar y correr. Las investigaciones que 
emplean un corredor requieren enseñar al animal a dónde correr y para qué. 
En contraste con la situación del corredor, en el entrenamiento de presión de 
la palanca de operante libre no se utiliza una respuesta de las ya existentes en el 
repertorio del sujeto. La mayoría de las ratas empleadas en los experimentos de 


O 


lo 0] 
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presión de la palanca no habían tenido nunca antes la oportunidad de presionar 
una palanca. Por tanto, como ya advertimos antes, en «Métodos de Operante 
libre», la conducta de presión de la palanca se tiene que formar por el reforza- 
miento de aproximaciones sucesivas. Exactamente ¿cómo se realiza este moldea- 
miento y qué se logra? Aunque las ratas pueden llegar a un experimento de 
presión de la palanca sin haber presionado nunca antes una palanca, no son 
totalmente inexpertas en cuanto a los distintos componentes de presión de la 
palanca. El presionar la palanca requiere que la rata se levante sobre sus patas 
traseras, que alargue una pata delantera y que con ella presione la palanca hacia 
abajo. Todas esas respuestas es probable que ya estén en el repertorio de la rata. 
¿Qué aprende la rata que sea nuevo? Aprende a realizar de forma coordinada los 
distintos componentes de la conducta de presión de la palanca, de manera que la 
palanca se baje y consiga el premio. A no ser que estas tres acciones -—ponerse a 
dos patas, adelantar la pata delantera y presionar hacia abajo— ocurran en una 
secuencia correcta y en el lugar adecuado de la cámara experimental, no dan lugar 
a la presión de la palanca. Así pues, el condicionamiento instrumental de presión 
de la palanca supone la reorganización de los componentes de la conducta de la 
rata. El condicionamiento instrumental puede llevar a la creación de una nueva 
unidad conductual que viene definida por los elementos requeridos para obtener 
el reforzador (véase Schwartz, 1981, para una discusión más extensa). 

Los ejemplos del corredor y de presión de la palanca ilustran que el condicio- 
namiento instrumental puede actuar sobre unidades conductujales ya existentes y 
dar lugar a la creación de otras nuevas. ¿Cuál es la posibilidad de generalización 


de esos procesos? ¿Puede el condicionamiento instrumental controlar la frecuen- 


cia de todas las conductas ya existentes? ¿Está limitada la diversidad de unidades 
conductuales nuevas que puede crear el condicionamiento instrumental? Las res- 
puestas a estas cuestiones son fundamentales para evaluar la generalidad del con- 
dicionamiento instrumental. 


Los límites de la respuesta en el condicionamiento instrimental. Durante 
los últimos veinticinco años se han aportado numerosos ejemplos de las limita- 
ciones de la respuesta en el condicionamiento instrumental. En el capítulo 4 
vimos que el condicionamiento clásico se producía a ritmos distintos, según la 
combinación EC-El que se utilizara, Las ratas, por ejemplo, aprenden en seguida a 
asociar los sabores con la enfermedad, en cambio no aprenden tan fácilmente las 
asociaciones entre los sabores y la descarga eléctrica. Estos ejemplos sugieren que 
el EC y el El deben ser «pertinentes», o ser «relevantes» para el El, con el fin de 
que el condicionamiento ocurra rápidamente. Se dan relaciones de pertinencia o 
de relevancia análogas en el condicionamiento instrumental. 

Thorndike fue el primero en observar diferencias en la condicionabilidad de 
distintas respuestas con reforzamiento. En muchos de los experimentos con cajas- 
problema, el gato tenía que manipular un picaporte o una cuerda para escapar de 
la caja. Sin embargo, Thorndike trató de condicionar también respuestas tales 
como los bostezos y el rascarse. Los gatos podían aprender a dar esas respuestas. 
Curiosamente, sin embargo, la forma de las respuestas cambiaba conforme avan- 
zaba el entrenamiento. Al principio, el garo se rascaba fuertemente para que se le 
sacara de la caja. En los últimos ensayos sólo hacía amagos de rascarse. Colocaba 
las patas en el cuerpo, pero no realizaba una verdadera respuesta de rascarse. Se 
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obtuvieron resultados similares en los intentos de condicionar el bostezo. Con- 
forme avanzaba el entrenamiento, el animal podía abrir la boca para que se le 
sacara de la caja, pero no daba un bostezo abierto. 

Thorndike propuso el concepto de pertinencia para explicar los fallos en el 
adiestramiento de las respuestas de rascarse y de bostezar. Según este concepto, 
ciertas respuestas tienen una relación natural con ciertos reforzamientos a causa 
de la historia evolutiva del sujeto. Movéase un picaporte o tirar de una cuerda son 
respuestas manipulatorias que tienen una relación natural con liberarse de un 
encierro: Por el contrario, rascarse y bostezar no se han desarrollado para ayudar 
“a escapar a los animales cuando están confinados, y por tanto no tienen relación 
con la liberación de la caja-problema. Presumiblemente ésta es la razón por la que 
rascarse y bostezar no persistieron como respuestas intensas cuando fueron refor- 
zadas con la liberación de la caja. 


El concepto de pertinencia en el condicionamiento instrumental está bien ilus- . 


trado en los resultados de un estudio con un pez llamado espinoso de tres espinas 
(Gasterostews aculeatus). En primavera, durante la época de apareamiento, el 
macho espinoso delimita su territorio, desde el cual sale a cazar, lucha contra 
otros machos y corteja a las hembras. Sevenster (1973) utilizó la presentación de 
otro macho o de una hembra como reforzadores para el condicionamiento ins- 
trumental del espinoso macho. Se requería que un grupo de sujetos mordiera una 
vara para tener acceso al reforzador. Morder es un componente de la conducta 
agresiva que se da cuando un macho residente se encuentra con un macho intruso. 


Cuando el reforzador era otro macho la respuesta de morder aumentaba; el acceso 


a otro macho era un premio eficaz para la respuesta de morder. Por el contrario, 
el morder no aumentaba cuando se reforzaba con oportunidades de cortejo. Sin 
embargo, la oportunidad de cortejo era un premio eficaz para Otras respuestas, 
como nadar a través de un aro. Evidentemente, existe una relación de pertinencia 
entre morder y la presentación a continuación de otro macho. Por el contrario, 
morder no está en relación con la presentación de una hembra, que de forma 
habitual' provoca cortejo en vez de agresión. 

Breland y Breland (1961) observaron varias limitaciones en el condiciona- 
miento instrumental. Estos se enfrentaron con dificultades interesantes cuando 


intentaron condicionar en varias especies respuestas instrumentales con un refor- | 


zamiento de comida. Su objetivo era entrenar a distintos animales con procedi- 
mientos de condicionamiento operante para que realizaran cadenas de respuestas 
graciosas, con el fin de exhibirlos en parques y zoos como diversión. En el trans- 
curso de este trabajo observaron cambios de conducta espectaculares que no eran 
congruentes con los procedimientos de reforzamiento que se habían estado 
usando. Por ejemplo, describen un mapache que era reforzado por recoger una 
moneda y depositarla en una hucha: 


Comenzamos reforzándole por recoger una sola moneda. Después se le presentaba un 
recipiente de metal y se le pedía que tirara la moneda dentro del recipiente. Aquí nos encon- 
tramos con la primera dificultad: parecía que tenía grandes problemas para desprenderse de la 
moneda. La frotaba contra el interior del recipiente, la volvía a sacar fuera y la agarraba 
firmemente durante varios segundos. Sin embargo, al final la soltaba y recibía su reforza- 
miento de comida. Después venía la última contingencia: le [pedíamos] que recogiera [dos] 
monedas y las metiera en el recipiente. 


Ahora el mapache tenía realmente problemas (y también nosotros). No sólo podía no. 
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desprend ] y 
Sd ] a de las monedas, sino que se pasaba segundos, e incluso minutos, frotando todas 
Ñ Ad mo un avaro) y metiéndolas en el recipiente. Siguió Hevando a cabo esta conducta 

: e que la aplicación práctica que nosotros teníamos sr mente —una exhibición 
presentando a un mapache metiendo monedas en una hucha de cerdito— simplemente no era 


factible. La conducta de frorar fue e 1 
o mpeorando conforme pasaba el tiempo, a pesar del no 


Los Breland tuvieron dificultades semejantes con otras especies. Los cerdos 
por ejempio, tampoco pudieron aprender a meter monedas en una hucha de cer- 
tto. Después de un entrenamiento inicial, comenzaban a hocicar las monedas por 
es a llamaron al desarrollo de estas respuestas, como hocicar en 
cerdos y frot iva instinti impli 
el término, as respuestas extra que se desacolln ea a, cmo implica 
l S Situaciones de reforza- 
miento de comida eran actividades que los animales instintivamente realizan 
cuando obtienen comida. Los cerdos hocican por el suelo en conexión con la ali- 
mentación, y los mapaches frotan y mojan los objetos relacionados con la comida 
Esas respuestas relacionadas con la comida son aparentemente muy fuertes 
pueden estar incorporadas en el repertorio del sujeto hasta el punto de que Edd 
piten con la respuesta que requiere el experimentador. Los Breland ale hinca- 


pié en que esas tendencias instintivas de respuesta tienen que tenerse en cuenta 
en el análisis de la conducta. e 


_ Análisis experimental de los límites de la respuesta en el condicionamiento 
instrumental. El tema de los límites de la respuesta para la eficacia del condi- 
cionamiénto instrumental ha tenido una extensa atención experimental en los 
últimos años (para una revisión reciente véase Domjan, 1983). Estas investiga- 
ciones han revelado un número de factores que determinan lo susceptible que A 
RDA respuesta concreta a la modificación a través del condicionamiento instru- 


a 


mental. Un factor importante es el estado motivacional del sujeto. El condicio- 


namiento instrumental implica motivar al sujeto de alguna manera (privándole 
de comida, por ejemplo), y el estado motivacional del sujeto limita el tipo de 
actividades que puede realizar. En los hámsters, por ejemplo, la PEacion de 
comida disminuye la probabilidad de las respuestas de cuidado de sí mismo, como 
lavarse la cara y rascarse, pero aumenta la probabilidad de las actividades diri idas 
al ambiente, como cavar, rascar una pared (escarbar) o levantarse sobre sus a 
traseras (Shettleworth, 1975). Esos cambios en la probabilidad de didas: res- 
puestas, inducidos por la privación de comida, están relacionados con la prontitud 
a E es las respuestas con el reforzamiento de comida. Las respuestas 
vación de comido, también avena o e entaa parle pad 
con un reforzamiento de 
comida. Por el contrario, las respuestas de cuidado de sí mismo (lavarse la cara 
rascarse), que descienden con la privación de comida, no se fortalecen rápido con 
un premio de comida (Shettleworth, 1975). Esos resultados sugieren que algunas 
limitaciones en el condicionamiento instrumental de ciertas respuestas son debi- 
das al hecho de que estas respuestas descienden por el estado motivacional (pri- 


mo. 


vación de. comida) establecido durante..el condicioriamiento instrumental. Dado 





* - : : 
a era «The Misbehavior of Organims» de K. Breland y M. Breland. En American Psycholo- 
Bist, 19 1, 16, 682. Copyright de la Asociación Americana de Psicólogos (1961). 
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APARTADO 5.3. Enseñar a tocar el violín 


Las investigaciones sobre las limitaciones de la respuesta en el condicionamiento ins- 
trumental indican que es importante considerar las tendencias de respuesta presentes en el 
sujeto de forma natural a la hora de diseñar los procedimientos de entrenamiento, Este 
principio sirve de base para un método de enseñanza del violín nuevo y totalmente satis- 
factorio, desarrollado por el violinista japonés Shinicki Suzuki. Es característico de los 
enfoques tradicionales de la enseñanza del violín comenzar enseñando a los estudiantes a 
asociar unas notas impresas en una partitura con una determinada posición de los dedos en 
el violín. Se pide además a los estudiantes que deslicen despacio el arco por las cuerdas 
para producir un sonido suave, Suzuki observó que ninguna de esas tareas se aproximaba a 
las tendencias naturales de respuesra de los niños pequeños. En cambio, muchos niños 
pequeños encuentran mucho más fácil asociar el sonido de una nota con una posición 
concreta de los dedos en el violín. Suzuki comparó esta característica del aprendizaje con la 
forma en que los niños aprenden el lenguaje de forma natural. En primer lugar, aprenden 
significados de palabras por el oído, no a través de la lecrura. Suzuki observó también que 
los niños pequefios encuentran mucho más fácil mover el arco sobre las cuerdas con 
movimientos rápidos y cortos que deslizarlo despacio. Y logró con éxito trasladar estas 
observaciones a un método de enseñanza. Con este método, que se ha adoptado en muchas 
partes del mundo, los niños no empiezari aprendiendo a leer música. Más bien, escuchan 
grabaciones de ciertas piezas y colocan los dedos en el violín hasta imitar esos sonidos. Por 
otra parte, al principio, en las píezas musicales se utilizan movimientos de arco rápidos y 
cortos exclusivamente. Los movimientos largos y suaves no se intentan hasta que el niño 
ha alcanzado una habilidad considerable. El resultado es que muchos niños han aprendido 
habilidades con el violín sumamente complejas, que los profesores en el pasado pensaban 
que eran imposibles de adquirir a una edad temprana. Además, dado que con esta técnica 
se aprovechan aquellas respuestas que se producen de forma más natural en los niños, 
éstos pueden empezar a interpretar melodías al principio de su entrenamiento y, por 
tanto, encuentran más placer en tocar. 
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que no es probable que los animales den respuestas de autoaseo. cuando están 
hambrientos, es difícil reforzar estas respuestas con comida (para otros estudios 
del refuerzo del aseo, véase Charlton, 1983; Iversen, Ragnarsdottir y Randrup, 
1984). 

Una segunda variable importante en la susceptibilidad de las diversas respues- 
tas “al "condicionamiento instrumental es la presencia de wna estimulación de 
apoyo'a la respuesta. instrumental. ¿Como saben bien los actores de paritónimas, 
es dificil ejecutar los movimientos de subir una escalera o de abrazar a alguien en 
ausencia de la escalera o de alguien a quien abrazar. Muchas respuestas instru- 
mentales, particularmente las que implican manipular algún aspecto del. ambiente, 
requieren una estimulación de apoyo que guíe la respuesta. La presencia de una 
estimulación de apoyo facilita sumamente la realización de la conducta. Pearce, 
Colwill y Hall (1978) obtuvieron pruebas de que la estimulación de apoyo puede 
también facilitar el aprendizaje instrumental. Sus estudios analizaban an 
miento de la conducta de rascarse en las ratas. Argumentaron que el rascarse 
podría ser dificil de aumentar con un reforzamiento de comida porque es difícil 
rascarse sin picor. Para proporcionar picor, Pearce y otros pusieron collares de 
plástico alrededor del cuello de las ratas. La estimulación cutánea que proporcio- 
naba el collar facilitó enormemente el condicionamiento instrumental del rascarse 
incluso después de que las ratas se habían acostumbrado totalmente a los collares. 

Un tercer factor que podría crear dificultades en el condicionamiento instru- 
mental de una respuesta es su nivel operante. Como ya advertimos antes, el nivel 
operante es la tasa de aparición de una respuesta antes de que se introduzca el 
procedimiento de condicionamiento instrumental Los estudios que comparan el 
coridicionamiento instrumental de respuestas como las de lavarse la cara, rascarse, 
escarbar, dejar rastro, empinarse y cavar, no han utilizado habitualmente proce- 
dimientos de moldeamiento. Por tanto, los investigadores tienen que confiar en la 
aparición espontánea de las respuestas antes de presentar el reforzador. Si una 
respuesta poseía un nivel operante muy bajo, no se presentaba a menudo y, por 
tanto, no podía ser reforzada a menudo. La baja frecuencia del reforzamiento 
podría ser entonces la responsable de la falta de aumento de la conducta. Á pesar 
de lo plausible que es esta explicación, muchos de los límites de la respuesta en el 
condicionamiento instrumental que hemos descrito no pueden atribuirse a bajos 
niveles operantes. En muchos estudios, las respuestas que no se incrementaban 
con el reforzamiento tenían una probabilidad de aparición antes del condiciona- 
miento igual que otros patrones de acciones que se modificaban más fácilmente 
(véase, por ejeraplo, Annable y Wearden, 1979; Charlton y Ferraro, 1982; Pearce 
y otros, 1978; Shettleworth, 1975, 1978b). 

El cuarto y último factor que vamos a considerar, ya que puede influir en la 
posibilidad de que una respuesta aumente con el reforzamiento, es la intrusión de 
respuestas incompatibles, clásicamente condicionadas, en el transcurso del condi- 
cionamiento instrumental. Es característico de los procedimientos de condiciona- 
miento instrumental el permitir la aparición del condicionamiento clásico. En los 
capítulos siguientes vamos a discutir las interacciones del condicionamiento clá- 
sico e instrumental con más detalle. En el presente contexto, el condicionamiento 
clásico es importante para el análisis de los resultados obtenidos por primera vez 
por Breland y Breland (1961). Como ya advertimos antes, estos investigadores 
hallaron que varias especies (los mapaches y los cerdos, por ejemplo) tenían difi- 
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cultades para aprender a recoger una moneda y depositarla en una ranura con un 
refuerzo de comida. En vez de depositar las monedas en la ranura, los animales 
las sostenían y manipulaban (véase también Boakes, Poli, Lockwood y Goodall, 
1978). Esta manipulación y agarre persistentes nunca se reforzaban explícita- 
mente, y de hecho daban como resultado la pérdida del reforzamiento de comida. 

Las investigaciones más recientes sugieren que el agarre y la manipulación 
persisterites de las monedas reflejan el condicionamiento clásico de las monedas 
con el reforzamiento de comida (Timberlake, 1983b; Timberlake, Wahl y King, 
1982). Cuando se refuerza a los animales con comida por recoger una moneda o 
introducirla por una ranura, éstos experimentan algo más que el emparejamiento 
de respuestas instrumentales concretas con el reforzamiento de la comida. Ciertos 
estímulos, en este caso los estímulos de las monedas, se están emparejando tam- 
bién con el reforzamiento de comida, y esto da lugar al condicionamiento clásico 
de los estímulos de monedas. Una vez que la moneda se condiciona a la comida, 
llega a provocar respuestas condicionadas relacionadas con la comida. Entre esas 
respuestas condicionadas relacionadas con la comida se incluyen agarrar y mani- 


pular el objeto-señal de la comida. La respuesta instrumental de depositar la : 


moneda en la ranura se desbarata con la aparición de las respuestas de manteni- 
miento y manipulación clásicamente condicionadas. 

Mantener y manipular las monedas era «maladaptativo» en los experimentos 
de Breland y Breland porque impedía a los sujetos satisfacer los requerimientos 
del procedimiento instrumental y obtener el reforzamiento de la comida. Lo que 
convertía a la conducta en maladaptativa era que el objeto-señal de la comida la 
moneda) era diferente del objeto de la comida. Fuera del laboratorio, los estímu- 
los señal de la comida y la comida en sí a menudo residen en el mismo objeto. 
Habitualmente, la señal de comida es un aspecto de la comida que es evidente a 
larga distancia. Ver un ratón corriendo por el suelo es una señal de comida para 
los gavilanes que vuelan por encima. Una cáscara de nuez entera es una señal de 
oa: para la ardilla. En esos casos, la aproximación y manipulación de la señal 
de comida ayuda a los animales a obtener realmente la comida. Así pues, las 
respuestas de sostener y manipular un objeto señal de comida, por lo general 
condicionadas clásicamente, son compatibles con y facilitan la respuesta instru- 
mental de obtención de la comida. El experimento de Breland y Breland producía 
conducta «maladaptativa» porque implicaba una separación inusual de la señal de 
comida y el objeto de comida. 


Comentario final sobre las limitaciones de la respuesta. La investigación 
sobre los límites de la respuesta en el condicionamiento instrumental ha confir- 
mado que algunas respuestas son más difíciles de modificar que otras con el con- 
dicionamiento instrumental. Sin embargo, esas limitaciones no deberían interpre- 
tarse como prueba de que el condicionamiento instrumental no es un proceso 
«general». Todos los fenómenos de la naturaleza están sujetos a condiciones 
límite concretas. Las investigaciones recientes sobre las limitaciones de la res- 
puesta han ayudado a especificar cuáles de esas condiciones límite son favorables 
para el condicionamiento instrumental, y por tanto han ayudado a determinar con 
po detalle las posibilidades de generalización del condicionamiento instru- 
mental, 
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El reforzador instrumental 


El segundo elemento fundamental del condicionamiento instrumental que 
vamos a considerar es el reforzador. Varios aspectos de un reforzador determinan 
sus efectos sobre el aprendizaje y la ejecución de la conducta instrumental. Vamos 
a considerar en primer lugar los efectos directos sobre la conducta instrumental 
de la cantidad y la calidad del reforzador. Después discutiremos cómo la respuesta 
a una cantidad y a un tipo particular de premio depende de la experiencia anterior 
con otros reforzadores. 


Cantidad y calidad del reforzador. Muchos estudios han evaluado la inflúen- 
cia de la cantidad y la calidad del reforzador en las situaciones de refuerzo y de 
castigo. El hallazgo básico de esos experimentos ha sido que el efecto en la con- 
ducta de un procedimiento de condicionamiento instrumental aumeéñta conforme 
Ta cantidad y la calidad del reforzador o castigador aumentan. Por ejemplo, las 


E Aa 


respuestas reforzadas con comida aumentan con él incremento de la cantidad y 
calidad de la comida presentada después de la respuesta, y las respuestas castiga- 
das con una descarga eléctrica se suprimen antes cuando la intensidad de la des- 
carga se incrementa. ] 

Aunque la cantidad y la calidad del reforzador son características lógicamente 
diferentes, a menudo es difícil separarlas experimentalmente. Un cambio en la 
cantidad del reforzador puede hacer también cualitativamente diferente al refor- 
zador. Un aumento en la intensidad de la descarga, por ejemplo, puede dar lugar 
a un tipo de malestar cualitativamente diferente. En un interesante experimento 
en el que se empleaba un reforzamiento positivo, Hutt (1954) intentó aislar los 
efectos de la cantidad y calidad sobre la conducta instrumental. Nueve grupos de 
ratas fueron entrenados para presionar una barra y así obtener un líquido como 
reforzador. Se variaba la cantidad y la calidad del líquido en los diferentes grupos. 
Tres de los grupos recibieron una pequeña cantidad de líquido, tres una cantidad 
media y tres una cantidad grande. El líquido era una mezcla de agua, leche y: 
harina. Uno de los tres grupos a los que se les dio una cantidad pequeña de 
líquido recibía esta mezcla básica. En otro grupo la calidad de la mezcla mejoraba 
añadiéndole sacarina, En el tercer grupo la calidad del líquido se reducía aña- 
diendo una pequeña cantidad de ácido cítrico. La figura 5.6 muestra la tasa media 
de respuestas (presión de la barra) por grupo. Los incrementos en la calidad o 
cantidad del reforzador producían tasas más altas de respuestas. 


Cambios en la cantidad y calidad del reforzador. En el estudio de Huct 
(1954), un sujeto determinado recibía una cantidad y calidad concretas de comida 
a lo largo del experimento. ¿Qué ocurriría si a los sujetos se les cambiase de uma 
clase de premio a otra? Esta es una cuestión particularmente importante porque 
plantea la posibilidad de que la eficacia de un reforzador concreto dependa no sólo 
de sus propiedades físicas sino también de la comparación que se produce entre 
un premio y los otros que el sujeto había recibido. Vimos.en.el capítulo 4.que la 
eficacia del estímulo incondicionado en el condicionamiento clásico depende de.la 


"comparación del, El con las expectativas del sujeto, basadas en su experiencia 


“anterior. Si el El es mayor.(o.más intenso) de lo que se esperaba, favorecerá el- 
condicionamiento excitatorio. Por el contrario, si es más pequeño (o más débil) 
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Respuestas por minuto 





? Pequeña Media Grande 
Cantidad y calidad del reforzador 


Figura 5.6.—Tasas medias de respuesta en grupos de sujetos para los cuales la respuesta fue reforzada 
con reforzadores de distinta cantidad y calidad. (Según Hutt, 1954.) 


de lo que se esperaba, favorecerá el condicionamiento inhibitorio, ¿Se producen 


efectos análogos en el condicionamiento instrumental según la cantidad y calidad. 


ar o 


.del premio?. Evidentemente, sí, “Numerosos ejemplos han mostrado que los efec- 
tos de una cantidad y un tipo concretos de premio en la conducta instrumental 
dependen de la cantidad y calidad de los reforzadores que el sujeto había experi- 
mentado previamente (véase Flaherty, 1982, para una revisión). Podría decirse 
que la investigación ha demostrado que un buen premio se considera como espe- 
cialmente bueno después de un reforzamiento con un premio pequeño, y un pre- 
mio pequeño se considera como especialmente pequeño después de uno bueno. 

Crespi (1942) fue el primero en describir los efectos de un cambio en la 
cantidad del premio. Los resultados básicos están muy bien ilustrados en un estu- 


dio más reciente de Mellgren (1972). Se utilizaron cuatro grupos de ratas en un . 


experimento de corredor. Durante la fase primera, dos de los grupos recibieron 
un premio pequeño (dos bolitas de comida) cada vez que llegaban al final del 
corredor. Los otros dos grupos recibían un premio grande (22 bolitas) por cada 
recorrido a lo largo del corredor. (La entrega del premio se retrasaba siempre 
veinte segundos después de que el sujeto llegaba al final del corredor, con el fin de 
que no corriera a una velocidad máxima.) Después de once ensayos de entrena- 
miento (fase primera), se reorganizó la distribución de los premios. A uno de los 
dos grupos que recibía un premio grande pasó a dársele un premio pequeño 
(G-P); igualmente, a un grupo de los dos con premio pequeño en la fase primera 
se le empezó a dar un premio grande (P-G). Los dos grupos restantes continua- 
ron recibiendo la misma cantidad de premio en la fase segunda que en la fase 
primera. (A esos grupos se les denominó P-P y G-G.) 
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Figura 5.7.—Nelocidades de ca- 
rrera de cuatro grupos de ratas, 
considerando bloques de tres en- 
sayos. El bloque «Pre» represen- 
ta las velocidades de carrera al 
final de la fase 1. Los bloques 1-4 
representan las velocidades de 
carrera en la fase 2. Al comienzo 
de la fase 2 los grupos G-P y P-G 
experimentaron un cambio en la 
cantidad de recompensa de gran- 
de a pequeño y de pequeño a 
grande, respectivamente. Los gru- 
pos P-P y G-G recibieron una 
misma recompensa, pequeña y 
grande respectivamente, a lo lar- 
go de todo el experimento. (Se- 
gún Mellgren, 1972.) 
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La figura 5.7 resume los resultados del experimento. Al final de la fase pri- 
mera, los sujetos que recibían el premio grande corrían algo más rápido que los 
sujetos que recibían un premio pequeño, pero no de una forma significativa. Para 
los grupos que siguieron recibiendo la misma cantidad de premios en la fase 
segunda que en la primera (grupos P-P y G-G), el rendimiento instrumental no 
cambió mucho cuando se introdujo la fase segunda. Por el contrario, se observa- 
ron desviaciones significativas a partir de la línea de base de la conducta de correr 
en los grupos de sujetos que sufrieron cambios en la magnitud del premio al 
comienzo de la fase segunda. Los sujetos que cambiaron de grupo grande a 
pequeño (G-P) bajaron rápidamente su velocidad de carrera, y los sujetos que 
cambiaron de pequeño a grande (P-G) aumentaron en seguida la velocidad de la 
carrera. El hallazgo más significativo fue que, después de un cambio en la magni- 
tud del premio, la conducta del sujeto no era solamente función de la nueva 
magnitud del premio. Más bien, la respuesta al nuevo premio se intensificaba a 
causa de la historia previa del sujeto con un premio con el que el nuevo paa 
taba en cuanto a magnitud. Los sujetos que pasaron de un premio pequeño a uno 
grande (grupo P-G) corrían más rápido por el premio grande que los sujetos que 
habían recibido siempre el premio grande (G-G). Paralelamente, los sujetos que 
pasaron de un premio grande a uno pequeño (grupo G-P) corrían más lenta- 
mente por el premio pequeño que los sujetos que habían recibido siempre el 
premio pequeño (grupo P-P). 

Los resultados que obtuvo Meligren ilustran el fenómeno del contraste con- 
ductual sucesivo, positivo y negativo. El.contraste conductual positivo: -se-rebiere, 


al hecho-de-que. los. sujetos-responden. más.a un. premio favorable si previamente 


han recibido un premio menos favorable que sí no han tenido esta experiencia 
“anterior. Por decirlo en términos poco científicos, el premio favorable parece 
especialmente bueno a los sujetos al contrastarlo con el premio peor que experi- 
mentaron antes. El contraste cc conductual negativo. se refiere al hecho de que.los 


a 


sujetos responden menos a un ñ premio < desfavorable si han recibido previamente 








A 
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un mejor premio que si no han, tenido. esta experiencia anterior. En este caso, el 
premio desfavorable parece especialmente malo a los sujetos al compararlo con el 
premio mejor que experimentaron antes. 

Los resultados de Mellgren ilustran los efectos del contraste conductual suce- 
sivo, porque se presentaron las dos alternativas del premio en fases diferentes del 
experimento, y la magnitud del premio sólo varió una vez en los grupos a los que 
se les cambió el premio. Se obtienen también contrastes positivos y NEBAtivos SI 
se cambian frecuentemente las alternativas del premio y hay algún tipo de clave 
que señale cada una de las alternativas del premio (véase Williams, 1983, para 
una revisión reciente). Estos procedimientos de contraste implican un contraste 
conductual simultáneo a causa de los frecuentes cambios de premio. Los procedi- 
mientos utilizados para producir el contraste simultáneo se llaman rambién pa- 
tas múlsiples de refuerzo. En el capítulo 8 consideraremos más pautas múlciples. 

Crespi (1942) sugirió que el fenómeno del contraste conductual sucesivo posi- 
tivo y negativo refleja las reacciones emocionales ante el cambio en las condicio- 
nes del premio. Un cambio de un premio pequeño a uno grande puede dar «ale- 
gría», lo que facilita las respuestas instrumentales. De forma análoga, un cambio 
en el premio de grande a pequeño puede producir «rabia»-0 frustración, lo cual 
altera las respuestas. Aunque en los últimos años se han propuesto algunos otros 
enfoques para la explicación del fenómeno de contraste (véase Flaherty, 1982), las 
explicaciones que hacen hincapié en las reacciones emocionales siguen siendo 
atractivas todavía. No se ha desarrollado aún con detalle una explicación del con- 
traste conductual positivo basada en la emoción. Se dispone de más información 
sobre los posibles mecanismos del contraste conductual negativo. 

El contraste conductual negativo puede explicarse en términos de los efectos 
emocionales que produce un cambio hacia abajo en las condiciones del premio, 
tomando como base la teoría de la frustración de Abram Amsel (1958, 1962, 
1967). Entre otras cosas la teoría de la frustración proporciona una definición 
técnica de la frustración. La esencia de la definición es que la frustración se pro- 

duce cuando el sujeto experimenta menos premio del que esperaba. La frustración: 


producida por el encuentro con menos cantidad o calidad de premio de la que.se. 


esperaba se llama frustración primaria, La frustración primaria se considera un 
“estímulo incondicionado, muy parecido a otros estímulos incondicionados con los 
que nos hemos encontrado. Como otros estímulos incondicionados, la frustración 
primaria provoca respuestas innatas, que en este caso consisten en la evitación del 
área de meta donde se encontraron con el premio frustrante. ¿Cómo ayudan estas 
ideas a explicar el contraste conductual negatrvo? Se produce un contraste conduc- 
tual negativo cuando se cambia a los sujetos de un premio grande a uno pequeño 

- (G-P). Mientras se les refuerza con un premio grande, los sujetos, presumible- 
mente, aprenden a esperar esa clase concreta de premio. Cuando se les cambia a 
un premio pequeño, el premio con el que se encuentran es menor de lo que 
esperaban, y por tanto se produce la frustración primaria. La frustración primaria 
lleva a evitar la caja de meta y también a disminuir la velocidad de la carrera. Esas 
carreras lentas no se observan en sujetos a los que siempre se les ha dado un 
premio pequeño (P-P). Esos sujetos nunca reciben un premio grande en esa 
situación, y por tanto mo aprenden a esperarlo. En consecuencia, el premio 
pequeño nunca constituye para ellos un premio menor del que esperan, y asi 
nunca experimentan frustración. : 
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La relación respuesta-reforzador 


Como ya hemos dicho, la conducta instrumental produce ciertas consecuencias 
y está controlada por ellas. Los animales y las personas ejecutan todo tipo de 
respuestas, que producen consecuencias diversas. En algunos casos, existe una 
relación directa entre lo que una persona hace y las consecuencias que tienen 
lugar. Si metemos una moneda de 50 pesetas en una máquina de café, obtenemos 
una taza de café. Mientras la máquina de café siga funcionando, seguiremos obte- 
niendo una taza de café cada vez que metamos las 50 pesetas que se exigen. En 
otros casos, no puede existir una relación entre una conducta y un resultado. 
Podemos llevar puesta una camisa roja a un examen y sacar una buena nota. Sin 
embargo, no atribuiriamos la buena nota al hecho de llevar una camisa roja. En 
otros casos, sin embargo, la relación entre una conducta y sus consecuencias puede 
ser imperfecta. Un animal puede buscar comida a menudo pero sólo lograr encon- 
traria algunas veces. 

Desde el punto de vista del organismo, entender la relación entre una con- 
ducta y sus consecuencias constituye un problema epistemológico. Los animales y 
las personas realizan respuestas de forma continua y experimentan todo tipo de 
acontecimientos ambientales. Estamos continuamente haciendo algo, aun en el 
caso de que estemos sentados y quietos, y, continuamente también, están ocu- 
rriendo cosas a nuestro alrededor. Para cualquier organismo un problema esencial 
es saber la forma en que su conducta se relaciona con los hechos ambientales que 
experimenta, Un organismo debe organizar su conducta para enfrentarse a diver- 
sos desafíos, y debe hacerlo de forma que aproveche al máximo su tiempo y su 
energía. Para ser eficaz, un animal debe saber de qué forma puede y de qué forma 
no puede controlar su ambiente. No vale la pena trabajar mucho para hacer que 
el sol salga por la mañana, porque en cualquier caso es un hecho que va a ocurrir. 
Tiene más sentido gastar las energías en construir un refugio o una cabaña para 
guardar comida (cosas de las que uno no dispone sin esfuerzo). Es preciso saber 
qué hechos están bajo nuestro control para poder distribuir los esfuerzos de una 
forma eficaz. 

La relación entre la conducta y sus consecuencias es uno de los factores más 
importantes en el control de la conducta instrumental. Cuando hacemos un estu- 
dio sobre la adquisición de la conducta instrumental en el laboratorio, es habitual 
que lo organicemos de forma que la respuesta instrumental produzca el reforza- 
dor sin retraso. Si una paloma picotea el estímulo clave tal como se requiere, 
inmediatamente recibe grano; si una rata hace el recorrido correcto en un labe- 
rinto en T, encuentra en seguida la comida. Nosotros, de una manera informal, 
pensamos que en esas situaciones de condicionamiento instrumental interviene 
una relación causa efecto. Los picoteos originan la entrega de grano, y el recorrido 
correcto origina el acceso a la comida. De hecho, sin embargo, están implicadas 
dos relaciones en esas situaciones. La primera de ellas es una relación temporal 
entre la respuesta instrumental y el reforzador. Si el reforzador se presenta inme- 
diatamente después de la respuesta, llamamos a esta relación contigúidad tem- 
poral, La segunda relación es la correlación entre la respuesta instrumental y el 
reforzador, o la contingencia respuesta-reforzador. La contingencia respuesta- 
reforzador es el grado hasta el cual la entrega de comida depende de la aparición 
anterior de la respuesta instrumental Los investigadores se han interesado 


O 
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sumamente en analizar la importancia de la contigiiidad temporal y de la contin- 
gencia respuesta-reforzador en el condicionamiento instrumental. 


Los efectos de la contigúidad temporal. Se ha investigado la importancia de 
la contigitidad temporal en el condicionamiento instrumental variando sistemáti- 
camente la demora entre la aparición de la respuesta instrumental y la presenta- 
ción subsiguiente del reforzador. Las primeras investigaciones sobre los efectos de. 
la demora del reforzamiento en el condicionamiento instrumental se llevaron a 

cabo utilizando un laberinto en T, en el que la respuesta instrumental consistía en 
tomar una dirección concreta. Se usaron grupos de ratas que recibían cada uno 
diferentes demoras en el reforzamiento. El reforzamiento se retrasaba encerrando 
a la rata en un compartimento después de que había realizado su elección, pero 
antes de permitirle entrar en la caja de meta y tener acceso al reforzador. La 
figura 5.8 resume los resultados de dos de esos estudios. En ambos experimentos 


el aprendizaje era.mejor cuando no existía demora en el reforzamiento, y descen-.. 


día, por tanto, cuando se incrementaban las demoras. Los datos de Wolfe (1934) 
muestran un ¿tadiente más pláno que los datos de Grice (1948). Los retrasos en 
el reforzamiento no alteraban el aprendizaje en el estudio de Wolfe tanto como 
en el de Grice. ¿Cómo se puede explicar esta diferencia en los resultados? 

A diferencia del experimento de Wolfe, el de Grice se diseñó especificamente 
para eliminar todas aquellas claves que no fueran el reforzador y que pudieran 
señalar a la rata que había dado la respuesta correcta y que la comida estaba 
próxima. Los estímulos asociados con la comida y que señalan la próxima presen- 
tación de comida se llaman reforzadores secundarios o condicionados. Existe 
toda una variedad de claves que pueden condicionarse como reforzadores. Si el 
premio de la comida se entrega siempre en el ala izquierda del laberinto en T, el 
ala izquierda puede convertirse en un reforzador condicionado. Los sujetos que 
entran en este ala se exponen inmediatamente al reforzador condicionado y, por 
tanto, no experimentan una demora del premio, aun cuando se retrase la presen- 
tación de la comida. Así pues, los reforzadores condicionados pueden permitir a 
los sujetos pasar por alto la demora entre la respuesta instrumental y la entrega 
del reforzador primario (véase Cronin, 1980; Winter y Perkins, 1982). 

En el experimento de Grice, la respuesta reforzada era elegir el ala blanca del 


APARTADO 5.4. Lg alabanza: una forma de cubrir el intervalo de demora 
en el reforzamiento 


Quizás el impedimento mayor para la aplicación de los principios de condicionamiento 
instrumental en varias siruaciones sea que a menudo no es conveniente entregar reforza- 
dores inmediatamente después de que se produce la respuesta deseada. Los domadores de 

" animales de circo suelen llevar con ellos comida durante las actuaciones para reforzar las 
respuestas correctas. Sin embargo, no siempre pueden darles los obsequios, potque los 
animales están demasiado lejos, o porque el comer puede distraer al animal de la siguiente 
respuesta. Por tanto, no es raro que los domadores utilicen alabanzas verbales. Palabras 
como «bien» o «así» pueden condicionarse para hacer de reforzadores condicionados con 
muchos animales, pronunciando las palabras siempre que se les entrega trozos de comida. 
La alabanza puede utilizarse para suministrar un reforzador inmediato y rellenar el inter- 
valo entre la ejecución de la respuesta condicionada y la entrega real del premio primor- 
dial. Esta es una razón por la que los domadores hablan a sus animales mientras actúan. 
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Figura 5.8,—Fuerza de la respuesta correcta en función de la demora del reforzamiento en dos expe- 
Timentos distintos. (Wolfe, 1934; Grice, 1948.) 


laberinto en T. Sin embargo, el ala blanca unas veces estaba a la derecha y otras a 
la izquierda. Por tanto, el premio de comida no se podía predecir a partir de las 
claves secundarias de torcer a la derecha o torcer a la izquierda, y éstas no se 
condicionaban como reforzadores. Grice se aseguró de que en su experimento los 
grupos de ratas a los que se retrasaba la entrega de comida después de la res- 
puesta de elección no recibieran un efecto retroalimentador inmediato de los 
reforzadores condicionados. Procedimientos como los de Grice que minimizan la 
posibilidad de un reforzamiento condicionado inmediato, es habitual que den 
como resultado un gradiente muy alto de demora del reforzamiento : 

Grice mostró que el condicionamiento instrumental puede alterarse mediante 
demoras en el reforzamiento tan cortas como cinco segundos. ¿Por qué el condi- 
cionamiento instrumental es tan sensible a la demora en el reforzamiento? Una 
respuesta posible a esta cuestión nos la proporciona la convicción de que la con- 
ducta consiste en una corriente continua de actividades. Cuando se retrasa el 
reforzamiento hasta después de la ejecución de una respuesta específica Ra, el 
sujeto no deja de responder. Después de la ejecución de Ra, el sujeto realiza otras 
actividades Rb, Rc, Rd, etc. Un premio que se demora puede entregarse después 
de la respuesta Rm. El problema para el sujeto entonces es distinguir entre Ra la 
respuesta instrumental en cuestión, de las otras respuestas que ejecutó durante el 
intervalo de demora. Si el sujeto no es capaz de distinguir Ra de sus otras accio- 
nes, una de esas otras acciones (probablemente la que esté más próxima a la 
entrega del Premio) se asociará con el reforzador. 

Las consideraciones anteriores sugieren que si la respuesta instrumental estu- 
viera marcada de forma que se la distinguiera dentro de la corriente continua de 
acciones del sujeto, la demora en el reforzamiento no tendría esos efectos nocivos 
sobre el condicionamiento instrumental. Lieberman, McIntosh y Thomas (1979) 
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comprobaron sus predicciones en un estudio con ratas, utilizando el laberinto que 
se muestra en la figura 5.9. Después de abandonar la caja de salida, las ratas 
tenían que elegir entre entrar en el ala blanca o en el ala negra. Se designó como 
respuesta instrumental correcta entrar en el ala blanca y se reforzó con el acceso a 
comida después de una demora de sesenta segundos en la caja de meta. Los dos 
grupos quedaron diferenciados por lo que les ocurría inmediatamente después de 
hacer la elección correcta. El experimentador sacaba a los sujetos del grupo «mar- 
cado» y los colocaba en la caja de demora. Por el contrario, a los sujetos del grupo 
«no marcado» no se les molestaba. Después de que daban la respuesta correcta, se 
les abría la puerta que había al final del corredor de elección, y se les permitía 
pasear por el interior de la caja de demora. De esta forma, la respuesta de elec- 
ción correcta no se distinguía de la corriente de otras actividades. Sesenta segun- 
dos después de la respuesta instrumental, se sacó a los sujetos de ambos grupos y 
se les colocó en la caja de llegada para que obtuvieran el reforzador. Se produjo la 
misma secuencia de hechos cuando los sujetos daban una respuesta incorrecta 
excepto que en esos casos no eran reforzados al final del intervalo de demora. 
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(negro) ] 
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Pigtera 5.9.—Vista superior del aparato y resulrados de un experimento para comprobar los efectos de 
marcar una respuesca en el condicionamiento instrumental con reforzamiento demorado 60 segundos. 
La elección del lado blanco fue designada como la respuesta instrumental correcta. Los sujeros pasaban 
el intervalo de demora en la caja de demora. Los sujetos «marcados» eran colocados en la caja de 
demora tras realizar su elección. A los sujetos «no marcados» se les permitía pasar caminando al 
interior de la caja de dernora sin ser molestados. (Según Lieberman y colaboradores, 1979.) 
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Los resultados del experimento se muestran en el gráfico de la figura 5.9. Los 
sujetos del grupo marcado aprendían la respuesta instrumental con una demora 
en el reforzamiento de sesenta segundos mucho mejor que los sujetos del grupo 
no marcado. Al cabo de cincuenta ensayos de entrenamiento, los sujeros marcados 
hacían la elección correcta el 90 por 100 de las veces. Por el contrario, los sujetos 
no marcados hacían la elección correcta el 50 por 100 de las veces aproximada- 
mente, una actuación que se considera debida al azar. En otro experimento, Lie- 
berman y otros demostraron que se lograba aprendizaje con un reforzamiento 
retardado cuando la respuesta instrumental estaba marcada por una luz breve e 
intensa, o por un ruido. Estos efectos que produce el marcar la respuesta no 


pueden ser explicados en términos de reforzamiento secundario o condicionado 


porque el estímulo de marcaje se presentaba tanto después de las respuestas 
correctas como de las incorrectas. Así pues, el hecho en sí de marcar un estímulo 
no informaba que el sujeto hubiera dado una respuesta correcta (véase también 
Thomas, Lieberman, McIntosh y Ronaldson, 1983). 

Los estudios sobre los efectos que produce el marcaje en las situaciones de 
reforzamiento retardado son estimulantes, pero están en sus comienzos. Futuras 
investigaciones tendrán que aclararnos la variedad de situaciones en que marcar 
facilita el condicionamiento retardado, qué clase de estímulos son marcadores efi- 
caces, y por qué. 


La contingencia respuesta-reforzador. En el capítulo 3 encontramos el tér- 
mino contingencia en la discusión sobre condicionamiento clásico. En.el condicio, 


namiento .clásico,.la contingencia se refiere a la relación predictiva entre los estí- 
mulos condicionado e incondicionado, En el condicionamiento instgumental, la 
contiñigencia.se refiere a la relación predictiva entre la respuesta instrumental y.el 
reforzador. Como ya se trató en el capítulo 3, la contingencia se define en térimi=— 


Pu 


nos de dos probabilidades. La contingencia respuesta-reforzador se define.en.téx- 


ao 


minos.de. la probabilidad de que el reforzador (Er +) se presente una vez que la 


Ae RS 


“respuesta instrumental (R) se ha efectuado [p(Er F/ R)] y la probabilidad de que 
.sé dé el reforzador una vez que la respuesta instrumental no'sé ha realizado 


[p(Er + / noR)]. Existe una contingencia positiva perfecta si se entrega el reforza- 


dor después de Cada aparición de la respuesta instrumental [p(Er + /R)= 10], pero 


nunca se entrega en ausencia de la respuesta [p(Er + / noR) =0]. Existe una con- 
tingencia negativa si el reforzador tiene más probabilidad de darse cuando la res- 
puesta instrumental no se ejecuta que cuando se ejecuta [p(Er+/noR) > 
p(Er+/R)]. Por último, existe una contingencia cero si el reforzador tiene la 
misma probabilidad de aparecer con respuesta instrumental que sin respuesta 
instrumental [p(Er+/R)=(Er+/noR)]. 

En todos los estudios de demora en el reforzamiento que se han revisado 
antes se da una contingencia positiva perfecta entre la respuesta y el reforza- 
miento, Aunque en algunos grupos se retrasó el reforzamiento, la probabilidad de 
reforzamiento fue de 1,0 siempre que se ejecutaba la respuesta instrumental, y no 
se suministraba nunca el reforzamiento si la respuesta instrumental no se presen- 
taba. El retraso en la aparición del reforzador después de la respuesta no cam- 
braba el hecho de que el reforzamiento dependiera totalmente de la ejecución 
previa de la respuesta instrumental. Los estudios sobre demora en el reforza- 
miento muestran que una contingencia perfecta entre la respuesta y el reforzador 
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no es suficiente para producir el condicionamiento instrumental, Aun depen- 
diendo totalmente del reforzamiento de las respuestas anteriores, resulta habitual 
que el condicionamiento no se dé si el reforzamiento se retrasa demasiado. 
¿Quiere esto decir que la contingencia entre la respuesta y el reforzador no es 
importante en el condicionamiento instrumental? 


La detección de la causalidad. Skinner fue-el primero en investigar si el con- 
dicionamiento es. posible en ausencia de una contingencia positiva respuesta- 
reforzador. Colocó varias palomas en cámaras experimentales separadas y pre- 
paró un aparato que entregaba un poco de grano cada quince segundos, indepen- 
dientemente de lo que las palomas estuvieran haciendo. Al cabo del rato Skinner 
volvió para véase lo que estaban haciendo y lo describió del modo siguiente: 


En seis de cada ocho casos las respuestas resultantes estaban definidas tan claramente que 
dos observadores podían coincidir perfectamente a la hora de computar los ejemplos. Un ave 
fue condicionada a dar vueltas en la jaula en dirección opuesta a la de las agujas del reloj, 
dando dos o tres vuelras entre los sucesivos reforzamientos. Otra, a meter la cabeza repetida- 
mente en una de las esquinas superiores de la jaula. Una tercera desarrolló respuestas de 
«sacudida», como si colocara su cabeza debajo de una barra invisible y la levantara una y otra 
vez [Skinner, 1948; pág. 168]. 


ue las pal 


A a a 


o/ reforzador cilando en realidad los prémios.se 
entregaban independientemente de, la conducta. .En..consecuencia, Skinner. do. 
denominó conducta supersticiosas: i o o 

La explicación de Skiñiner.sobre la conducta supersticiosa:descansa en la idea 


de reforzamiento accidental o, adyenticio. Los animales están siempre haciendo 


A Skinner, le parecía 


e Ea OS 
viera controlada por la entrega d 





algo; aunen ertaso de que no.se.les-pida -ninguoa respuesta para. obtener. refogs 
zamiento. Skinaer sugirió que.cualquier.respuesta que da-una paloma-inmediata- . 


“mén 


te antes de la entrega de un reforzador se fortalece, y posteriormente 


uña respuesta cón la entrega de in reforzador se llama reforzamiento adventacio. 


Un emparejamiiento accidental con un reforzador aumenta la probabilidad de que 
se repita la misma respuesta justo antes de la siguiente entrega del premio. Una 
segunda contigiiidad fortuita respuesta-reforzador fortalece aún más la probabili- 
dad de la respuesta. De esta forma, cada emparejamiento accidental ayuda a 
«estampar» una respuesta particular. Al cabo de un rato, la respuesta aparecerá 
con la frecuencia suficiente para identificarla como conducta supersticiosa, 

La interpretación que Skinner hacía de su experimento era atractiva y cohe- 
rente con las concepciones del reforzamiento que se mantenían entonces. Impre- 
sionados por los estudios sobre demora en el reforzamiento, los teóricos pensaban 
que la contigúidad temporal era el factor fundamental responsable del aprendi- 
zaje. El experimento de Skinner parecía apoyar esta concepción y sugería que una 
contingencia positiva respuesta-reforzador mo es necesaria para el condiciona- 
miento instramental, 

Las recientes investigaciones han planteado serias dudas sobre las conclusio- 
nes de Skinner. Aunque Skinner entregaba comida a sus palomas independiente- 
mente de su conducta, las entregas de comida eran predecibles porque tenían 
lugar cada quince segundos. Staddon y Stmmelhag (1971) cuestionaron el experi- 


omas respondían como si su conducta estu- 


aufnenta su frecuencia a causa del reforzamiento. El'empárejamiento accidental de 
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mento de Skinner y probaron que la conducta «supersticiosa» que Skinner 
observó estaba provocada por la predictibilidad de la entrega de comida, no por el 
reforzamiento adventicio. Hallaron que las palomas dan diferentes tipos de res- 
puestas durante cortos intervalos entre las presentaciones de la comida. Hacia el 
final del intervalo, tienden a ejecutar respuestas relacionadas con la comida, Esas 
respuestas pueden llegar casi a estereotiparse, produciendo la impresión de que 
las palomas son supersticiosas. (Volveremos a una discusión más detallada del 
experimento de Staddon-Simmelhag en el capítulo 7.) 

El análisis de Skinner de la conducta «supersticiosa» se ha puesto también en 
cuestión con la reciente evidencia de que los animales son capaces de detectar si 
su conducta genera o no unos resultados en el ambiente. Killeen (1981; véase 
también Kitleen y Smith, 1984) ideó un procedimiento ingenioso para conseguir 
que las palomas le dijeran si un resultado habta sido originado por su conducta. 
Metió las palomas en una cámara experimental con tres teclas para picotear colo- 
cadas en línea a lo largo de una pared. Durante el 5 por 100 del tiempo de la 
prueba, un picotazo en la tecla central daba lugar a que la luz de este estímulo se 
apagara durante el 5 por 100 del tiempo. Ocasionalmente, sin embargo, la luz de 
la tecla central se apagaba por orden de una computadora, independientemente de 
la conducta de las palomas. Cada vez que se oscurecía el estímulo central, se 
«pedía» a las palomas que informaran si habían sido ellas o el ordenador los 
causantes de que la luz se apagara. S1 eran las palomas las que habían originado el 
apagón, los picotazos en la tecla izquierda se reforzaban con comida; si era el 
ordenador el que había causado el que la luz se apagara, los picotazos en la tecla 
de la derecha se reforzaban con comida. Así, picoteando a la izquierda o a la 
derecha (teclas laterales «yo lo hice» o «el ordenador lo hizo»), las palomas 
podían comunicar si era su conducta la responsable del oscurecimiento de la tecla 
central, 

Las palomas hicieron una valoración de la causalidad sorprendentemente 
exacta. Dieron una información correcta entre el 80 y el 90 por 100 de las veces. 
Cómo podían conseguir este nivel resultaba claro en algunos aspectos de su con- 
ducta. Por ejemplo, un ave picoteaba la tecla central con movimientos cortos y 
rápidos. Si la luz se apagaba mientras estaba picoteando, elegía la tecla del lado de 
«yo lo hice». Entre picotazo y picotazo en la tecla central, la paloma se ponía 
delante de la tecla lateral «el ordenador lo hizo». Si la luz central se apagaba 
mientras la paloma se ponía enfrente de la tecla lateral «el ordenador lo hizo», 
picoteaba esa tecla. 


Los efectos de la capacidad de control de los reforzadores. Una contingencia 
fuerte entre una respuesta instrumental y un reforzador significa esencialmente 
que la respuesta controla al reforzador. Con una contingencia fuerte, la aparición 
o no de un reforzador depende de que se haya producido la respuesta instrumen- 
tal. Los estudios sobre los efectos que tiene el poder controlar los reforzadores 
han proporcionado el grueso de los datos acerca de la sensibilidad de la conducta a 
las contingencias respuesta-reforzador, Aunque en algunos de estos estudios se 
emplea un reforzamiento positivo (por ejemplo, Caspy y Lubow, 1981; Engberg, 
Hansen, Welker y Thomas, 1972), la mayoría de las investigaciones tratan los 
efectos del control sobre la estimulación aversiva (véase Alloy y Seligman, 1979; 
Maier y Seligman, 1976; Maier y Jackson, 1979; Seligman y Weiss, 1980). 
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Las investigaciones contemporáneas acerca de los efectos que la capacidad de 
control de la estimulación aversiva tiene sobre el aprendizaje se originaron con 
los estudios pioneros de Seligman, Overmier y Maier (por ejemplo, Overmier y 
Seligman, 1967; Seligman y Maier, 1967), que investigaron los efectos de la expo- 
sición a una descarga eléctrica incontrolable sobre el posterior aprendizaje de 
escape-evitación. El hallazgo común fue que la exposición a una descarga incon- 
trolable altera el posterior aprendizaje. A este fenómeno se le ha venido a llamar 
efecto de la indefensión aprendida. Los experimentos de indefensión aprendida 
se solían llevar a cabo en dos fases con tres grupos de sujetos. Los diversos grupos 
difteren sólo en lo que les ocurre durante la primera fase del experimento. Un 
grupo hace de grupo de control no estresado, y no recibe ninguna descarga 
durante la fase 1. El segundo grupo se expone a una serie de descargas breves de 
las que puede escapar realizando una respuesta de escape determinada, como pre- 
sionar un panel. El tercer-y más interesante grupo del experimento, recibe des- 
cargas de la misma intensidad y duración que la de los animales con posibilidad de 
escape. Sin embargo, para estos sujetos las descargas son incontrolables, pues no 
disponen de respuestas.de escape o de evitación. Al día siguiente, todos los sujetos 
reciben un entrenamiento de escape-evitación en un nuevo aparato, tal como una 
caja lanzadera. Una caja lanzadera consiste en dos compartimentos adyacentes 
separados por una barrera baja (véase figura 9.4). Las descargas se presentan 
periódicamente precedidas por una señal. Los animales pueden evitar la descarga 
saltando por encima de la barrera durante la señal de descarga. Si no son capaces 
de dar la respuesta de evitación a tiempo, se presenta la descarga, y saltar al otro 
compartimento por encima de la barrera sirve como respuesta de escape para 
interrumpir la descarga. 

El hallazgo espectacular en los experimentos del efecto de indefensión apren- 
dida es que la exposición a una descarga incontrolada durante la fase 1 produce un 
déficit más grave en el aprendizaje de escape-evitación que la exposición a des- 
cargas de idéntica intensidad y duración, pero de las cuales se puede escapar, En el 
grupo de escape se observa también un pequeño déficit en el aprendizaje en 
comparación con los sujetos que no recibieron ninguna descarga durante la fase 1. 
Sin embargo, este déficit no es tan grave como el que se observa entre los anima- 
les expuestos a una descarga ineludible. Así pues, en gran medida, el déficit en el 

"aprendizaje de escape-evitación en la fase 2 está relacionado con la posibilidad de 
control de las descargas anteriores, y no sólo con la exposición a ellas. Las inves- 
tigaciones recientes han mostrado que los efectos perjudiciales de la exposición a 
una descarga incontrolable son también evidentes cuando los sujetos reciben des- 
pués condicionamiento instrumental con un reforzamiento de comida (Caspy y 
Lubow, 1981; Rosellimi y DeCola, 1981; Rosellini, DeCola y Shapiro, 1982). 

El hecho de que la falta de control sobre la descarga cree un déficit general en 
la conducta instrumental subsiguiente sugiere que los animales son sensibles a la 
relación de contingencia entre su conducta y el reforzador. Seligman y sus colabo- 
radores propusieron una explicación de este efecto de interferencia que hace hin- 
capié en la detección de las contingencias respuesta-reforzador. Esta explicación, 
conocida como la hipótesis de la indefensión aprendida, sostiene que durante la 
exposición a descargas incontrolables, los animales aprenden que las descargas 
son independientes de su conducta y que no hay nada que ellos puedan hacer para 
controlar las descargas. Durante el condicionamiento instrumental subsiguiente, 
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esta expectativa adquirida de una contingencia cero entre las respuestas y la des- 
carga interfiere con el aprendizaje de que la conducta puede controlar las presen- 
taciones de un reforzador. La hipótesis de la indefensión aprendida sostiene que 
los animales deben hacer dos cosas cuando reciben condicionamiento instrumen- 
tal después de una exposición a descargas ineludibles: tienen que abandonar su 
expectativa de falta de control sobre los reforzadores, y tienen que aprender que 
ahora se requiere una respuesta concreta para obtener el reforzamiento. 

La interpretación de la indefensión aprendida ha generado una controversia 
considerable (por ejemplo, Black, 1977; Levis, 1976). Las investigaciones han 
demostrado que el déficit en el aprendizaje instrumental que proviene de la expo- 
sición a una descarga ineludible no se debe siempre al aprendizaje de una expecta- 
tiva de una contingencia cero entre las respuestas y la estimulación aversiva. En 
algunos casos, la descarga ineludible produce un descenso en el movimiento 
motor o una perseverancia de la respuesta, que serían responsables de los déficits 
en las actuaciones siguientes (Anderson, Crowell, Cunningham y Lupo, 1979; 
Anisman, De Catanzaro y Remington, 1978; Anisman, Hamilton y Zacharko, 
1984; Irwin, Suissa y Anisman, 1980). Sin embargo, existen también situaciones 
en las que es probable que los efectos sobre el aprendizaje no se deban a la 
supresión del' movimiento causado por una descarga ineludible (por ejemplo, 
Jackson, Alexander y Maier, 1980; Rosellini, DeCola, Plonsky, Warren y Stilman, 
1984). La diversidad de los hallazgos sugiere que la exposición a una estimulación 
aversiva incontrolable puede activar distintos procesos, entre los que se incluye la 
indefensión aprendida (Maier y Jackson, 1979). 

Una de las áreas de investigación contemporáneas más interesantes se refiere 
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APARTADO 5.5. Aplicaciones humanas del concepto de indefensión 


El hecho de que un historial de falta de control sobre los reforzadores pueda desorgani- 
zar de forma tan grave la conducta instrumental posterior tiene implicaciones importantes 
en la conducta humana. El concepto de indefensión se ha extendido a distintas áreas de 
interés humano, entre las que se incluyen la depresión, el rendimiento intelectual, la sus- 
ceptibilidad a los ataques del corazón, el envejecimiento y la muerte, el sacrificio y el” 
desamparo (véase Garber y Seligman, 1980). Un aspecto interesante de esas aplicaciones 
es que, con los seres humanos, la incontrolabilidad de los hechos aversivos no es suficiente 
para producir un efecto de indefensión. La forma en que cambia la conducta de alguien 
como resultado de un hecho desagradable depende de la manera en que la persona inter- 
preta las causas de ese hecho negativo (Peterson y Seligman, 1984). Considérese, por 
ejemplo, el sacar una puntuación baja en un examen. El grado de depresión o de desánimo 
que nos produzca esta experiencia dependerá de a qué causas achaquemos esa mala nota. Si 
decidimos que la mala nota se debe a que no somos muy inteligentes, nos desanimaremos a 
estudiar y podríamos abandonar la facultad, Una atribución así es (1) global (no ser muy 
inteligente influye en las cosas que uno hace), (2) interno (el problema se debe a uno 
mismo y no a la situación en la que se está), (3) estable (el nivel de inteligencia es difícil 
de cambiar). Las interpretaciones globales, internas y esrables de las causas de las expe- 
riencias aversivas tienden a reprimir la conducta instrumental y conducen a la depresión. 
Otras interpretaciones no tienen unos efectos tan nocivos. Por ejemplo, si atríbuimos el 
sacar una mala nota a que nos dieron un examen equivocado, o injusto, es menos probable 
que la mala nota nos deprima. Tales atribuciones son específicas, externas o inestables. Un 
examen equivocado o injusto no influye en nuestra conducta en general, no indica nada 
sobre nuestra personalidad, y no es probable que vuelva a ocurrir cada vez que realizamos 
una prueba. 
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a los efectos de las descargas ineludibles y eludibles sobre los opiáceos endógenos 
y la sensibilidad al dolor (véase Maier, Drugan, Grau, Hyson, MacLennan, Moye, 
Madden y Barchas, 1983). La exposición a acontecimientos estresantes estimula 
procesos de recuperación, entre los que se incluye una reducción de la sensibilidad 
al dolor (Bolles y Fanselow, 1980; Ross y Randich, 1984). La sensibilidad al dolor 
se regula en parte por las neuronas del cerebro, que son activadas con sustancias 
neurotrasmisoras especiales llamadas «opiáceos». Estas neuronas pueden acti- 
varse con opiáceos como la morfina y la heroína que se introducen desde fuera del 
Cuerpo. Las neuronas también se activan con opiáceos que el cuerpo produce y 
libera internamente como parte de un proceso fisiológico normal. Estos opiáceos 
liberados internamente, llamados opiáceos endógenos, intervienen en algunos de 
los cambios de sensibilidad al dolor que resultan de una exposición a hechos 
aversivos. 

Maier y sus colaboradores han estado investigando posibles relaciones entre 
los opiáceos endógenos, la analgesia (reducción de la sensibilidad al dolor) indu- 
cida por el estrés, y los efectos de la indefensión aprendida en las ratas. Jackson, 
Maier y Coon (1979) mostraron que el tipo de exposición a la descarga que pro- 
duce los déficits de aprendizaje en los experimentos de indefensión también 
reduce la sensibilidad al dolor. Además, la falta de control sobre la descarga es 
esencial para esta analgesia inducida por el estrés, Las investigaciones posteriores 
han mostrado que la reducción de la sensibilidad al dolor está mediada por el 
sistema analgésico de los opiáceos (Maier y otros, 1980; Maier, Sherman, Lewis, 
Terman y Liebeskind, 1983). La exposición a una descarga ineludible no produce 
analgesia si a los sujetos se les inyecta una droga (naltrexona) que impide que los 
opiáceos estimulen las neuronas pertinentes. Estos resultados son muy importan- 
tes porque muestran que los sistemas neurológicos implicados en el control del 
dolor están, en gran parte, influidos por factores «psicológicos», como la posibili- 
dad de controlar el origen del dolor. 

Todavía no se ha determinado, totalmente, la forma en que la analgesia indu- 
cida por estrés está relacionada con los efectos de indefensión aprendida. La 
prueba de que los dos fenómenos están relacionados nos la proporciona el hecho 
de que los procedimientos de descarga que producen efectos de indefensión 
aprendida también dan lugar a la analgesia (por ejemplo, Jackson y otros, 1979), y 
los procedimientos que eliminan los efectos de indefensión también eliminan el 
efecto de la analgesia (Moye, Coon, Grau y Maier, 1981; Moye, Hyson, Grau y 
Maier, 1983). Otras investigaciones indican que la reducción en la sensibilidad al 
dolor está implicada en los déficits de respuesta producidos por descargas ineludi- 
bles, pero pueden no intervenir en los déficits del aprendizaje de una asociación 
(Maier, Drugan, Grau, Hyson, MacLennan, Moye, Madden y Barchas, 1983). 

Las investigaciones sobre los efectos de la posibilidad de control de la descarga 
sobre la analgesia inducida por estrés proporcionan más datos sobre la sensibili- 
dad de los sujetos a las contingencias respuesta-reforzador. Estos trabajos también 
han servido para ilustrar algunos conceptos suministrados por la investigación 
básica en aprendizaje y conducta. El interés por la importancia de las contingen- 
cias respuesta-reforzador llevó al descubrimiento del efecto de indefensión adqui- 
rida. Dado que la mayoría de las investigaciones sobre el efecto de indefensión 
adquirida en los animales incluían una exposición a una descarga eléctrica, los 
investigadores se interesaron por conocer cómo influía la posibilidad de control 
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de la estimulación aversiva en la percepción del dolor. Esta ea an 
vez, condujo a otras investigaciones sobre el efecto de la posibil ad de E ES 
sobre los mecanismos neurofisiológicos del dolor. Muchos ray nn c Pp a 
les sobre los factores psicológicos en la percepción del dolor y la neurofisio ogía 
del dolor podrían no haberse producido sin las primeras a e a 
aprendizaje y conducta. Los estudios sobre aprendizaje y conducta descul 0 
los fenómenos conductuales básicos que en investigaciones posteriores se inten 
explicar a través de otro tipo de experimentación. 


COMENTARIOS FINALES 


Como hemos visto, los organismos son sensibles a la pi rige E a 
la contingencia, entre una respuesta instrumental y un an Es Ya A 
estos dos aspectos de la relación de la respuesta con el a a e : q a 
tamente para producir aprendizaje (Davis y Platt, 1983). Los dos factores er 
para determinar los efectos del reforzamiento en la A me 
relación de dependencia o contingencia asegura que el reforzad e se pcmes 
sólo después de la aparición de la respuesta instrumental pe 8 a aa 
de inmediatez asegura que entre la respuesta específica y el reforzador no 
otras actividades que interfieran e interrumpan el condicionamiento. 





Capítulo 6 
PROGRAMAS DE REFORZAMIENTO Y CONDUCTA 


DE ELECCION 


En el capítulo Ó vamos a discutir más ampliamente la relación respuesta- 
reforzador en la conducta instrumental, describiendo los efectos de distintos pro- 
gramas de reforzamiento. Los programas de reforzamiento son patrones o reglas 
que determinan la forma en que la conducta instrumental está relacionada con el 
reforzamiento. Vamos a comenzar describiendo programas simples y los efectos 
de los programas de reforzamiento sobre las respuestas individuales. Después 
describiremos la importancia de los programas de reforzamiento en el análisis y 
el control de la conducta de elección, y vamos a advertir que, en cierto sentido, 
toda conducta implica una elección. El capítulo termina con una discusión sobre la 
forma en que los patrones de reforzamiento empleados durante el cofidiciona- 
miento y mantenimiento de la respuesta influyen sobre la persistencia de la con- 
ducta cuando empieza la extinción y no se suministra más reforzamiento. 


PROGRAMAS SIMPLES DE REFORZAMIENTO INTERMITENTE 
Programas de razón 
Programas de intervalo 
Comparación de los programas de razón con los de intervalo 
PROGRAMAS DE REFORZAMIENTO DE LA TASA DE RESPUESTAS 
PROGRAMAS CONCURRENTES: EL ESTUDIO DE LA CONDUCTA DE 
ELECCION 
Medidas de la conducta de elección 
La ley de la igualación 
Efectos de las variaciones en el programa concurrente 
Condiciones de la igualación 
Extensión de la ley de igualación a los programas simples de refor- 
zamiento 
La igualación y el concepto del valor del reforzamiento 
Mecanismos de la ley de la igualación 
Las tasas de igualación y de optimización del reforzamiento 
Teorías moleculares 
Teorías molares 
La optimización como objetivo más que como mecanismo 
Mejoramiento 
PROGRAMAS CONCURRENTES ENCADENADOS: EL ESTUDIO DE LA 
ELECCION COMPLEJA 








LA EXTINCION 

Efectos de los procedimientos de la extinción 

Determinantes de los efectos de la extinción 

Mecanismos del efecto del reforzamiento parcial sobre la extinción 
COMENTARIOS FINALES 
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El capítulo 5 concluía con una discusión sobre la importancia de la da 
respuesta-reforzador en el condicionamiento instrumental. El ES ap 1004 
dedica a una discusión más amplia de este elemento fundamental el con 15 a 
miento instrumental. Al describir en el capítulo 5 varios procedimientos e con- 
dicionamiento instrumental ha podido quedar la impresión de que en dee Do 
dimientos cada aparición de la respuesta instrumental daba lugar a ea 
tación del reforzador. Á primera vista podría parecer que una e od 
perfecta entre la respuesta y el reforzamiento es rara fuera del A E 
sacamos buenas notas siempre que pasamos mucho tiempo estudiando. No su 
mos al autobús cada vez que vamos a la parada. No siempre que as z 
alguien a cenar resulta la velada agradable. De hecho, en la mayoría de los ro 
Ja relación entre las respuestas instrumentales y el reforzamiento e sigu de 
bastante compleja. Los intentos de estudiar la forma en que ee a o. 
plejas controlan la aparición de las respuestas instrumentales n llevado 
tigar en el laboratorio los programas de reforzamiento. 


Í ina la forma 
Un programa de reforzamiento. es una pauta o regla que determina la forma | 


y el momento en que la aparición de. una:respuesta ya a. y ida de na OR 
dor. Existe un número infinito de formas de llevar a cabo ese programa. eE 
entrega de un reforzador puede depender de la aparición de un AS E 
respuestas, del paso del tiempo, de la presencia de ciertos estím PES e la a 
ción de otras respuestas del animal, o de multitud de cosas. a ría qa a 
la catalogación de los efectos conductuales producidos por los E prog a 
de reforzamiento posibles fuera una tarea difícil. Sin embargo, a Investig de 
hasta ahora ha demostrado que la tarea es bastante manejable. Los cia 
reforzamiento que implican relaciones similares entre los Deseos a E 
tas y los reforzadores producen, normalmente, patrones de con: E pa e : 
tasa exacta de respuestas puede variar de una situación a otra. 5ín em E 
patrón que sigue la tasa de respuesta suele ser, era pa A 
Esta regularidad ha A el estudio de los programas de reforzam 
interesante y fructilera. 
o opina de reforzamiento influyen tanto en la manera en e E 
aprende la respuesta instrumental como en la manera en dre F m: ando 
después mediante el reforzamiento. Tradicionalmente, stn em Es os E 
gadores que han estudiado los efectos de estos programas han estado de pe 
sados en lo relativo al mantenimiento de la conducta. Los Pia re 
miento se han investigado fundamentalmente en las cajas de Skinner, que 
permiten una observación continua de la conducta, de forma que las rica 
en la tasa de respuesta pueden ser observadas y analizadas fácilmente a da 5 
plo, Ferster y Skinner, 1957). Rara vez interesa Cómo se forma y se ps Ps E 
principio la respuesta. Á menudo, un programa de CO pi re 
producirá su patrón de conducta instrumental caracteristico, independien 
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de la manera en que se aprendió originariamente la respuesta. Así pues, las inves- 
tigaciones sobre los patrones de reforzamiento han suministrado gran cantidad de 
información sobre los factores que controlan el mantenimiento y la ejecución de 
la conducta instrumental más que sobre el aprendizaje de ésta. 

La investigación de los mecanismos de reforzamiento que mantienen las res- 
puestas instrumentales es tan importante para la comprensión de la conducta 
como la investigación de los mecanismos que promueven el aprendizaje de nue- 
vas respuestas. La conducta de un animal está más centrada en repetir respuestas 
que se aprendieron previamente que en adquirir respuestas nuevas. Los seres 
humanos también pasan mucho tiempo realizando tareas sumamente familiares. 
Las condiciones de reforzamiento que mantienen la conducta son de gran interés 
para los jefes, que tienen que asegurarse de que sus empleados continúen 
haciendo el trabajo que aprendieron previamente. Los profesores, incluso, suelen 
estar más interesados en fomentar la aparición de respuestas ya aprendidas que 
en enseñar respuestas nuevas. Muchos estudiantes que trabajan poco en la escuela 
saben perfectamente cómo hacer los deberes y cómo estudiar, pero, simplemente, 
escogen no hacerlo. Los profesores pueden utilizar la información sobre los efec- 
tos de los programas de reforzamiento para motivar a sus alumnos. 


PROGRAMAS SIMPLES DE REFORZAMIENTO INTERMITENTE 


La importancia de los programas de reforzamiento en el estudio de la con- 
ducta instrumental reside en que son responsables en gran parte de las variacio- 
nes en la frecuencia y en la pauta de las respuestas instrumentales. Los programas 

de reforzamiento activan de diferentes maneras Jos. procesos que organizan y 
dirigen la conducta instrumental. El programa más simple es un programa de 
reforzamiento continuo, en el que cada aparición de la respuesta instrumental da 
lugar a la presentación del reforzador, El reforzamiento continuo rara vez ocurre 


“fuera-del laboratorio porque el mundo no es perfecto. Si apretamos el botón del 


ascensor, éste viene normalmente, pero de vez en cuando el ascensor se estropea, 
de forma que apretar el botón no sirve de nada. La respuesta instrumental sólo 
algunas veces produce un reforzamiento. Las situaciones en las que las respuestas 


sólo se. refuerzan algunas. veces, se dice que contiénen un programa de reforza- 


miento parcial o intermitente. Existen muchas formas de conseguir que las res- 


“puestas sean reforzadas intermitentemente. Para empezar, describiremos patro- 


nes intermitentes que utilizan reglas relativamente simples para determinar las 
respuestas que se van a reforzar, 


Programas de razón 


La característica definitoria. delos programas. de razón es que el reforza=- 


.Mmiento.depende, sólo del número. de respuestas que da el sujeto. El programa que 


relaciona las respuestas con el reforzamiento requiere simplemente contar las 
respuestas y presentar el reforzador cada vez que se alcanza el número de res- 
puestas establecido. Se podría, por ejemplo, presentar el reforzador después de 
que la rata ejecutara la décima respuesta de presión de la palanca. En ese. pro” 
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grama, por.ejemplo, existiría una razón fija entre el número de respuestas que el 
sújéto daba, y el .aúmero.de reforzadores que conseguía. (Habria siempre diéz 
respuestas por reforzador.) Esto convierte al procedimiento en un programa de 


po o ¿EN pi y E pt UT > + 
razón fija, Más espécificamente, el procedimiento se llamaría programa de razón 


“fija TO (de forma abreviada RE 10). Los programas de razón fija se encuentran en 


la vida diaria siempre que se requiera un determinado número de respuestas para 
obtener un reforzamiento. El repartidor que siempre tiene que visitar el mismo 
número de casas para completar su ruta está trabajando en un programa de razón 
fija. El trabajo a destajo en las fábricas se lleva a cabo en un programa de razón 
fija: se paga a los trabajadores por cada tantas piezas que juntan. La subida de las 
escaleras nos proporciona otro ejemplo. En una escalera determinada, tenemos 
siempre que subir el mismo número de escalones para alcanzar el siguiente 
rellano. , 

Estrictamente hablando, un reforzamiento contínuo es también un programa 
de razón fija. El reforzamiento depende sólo del número de respuestas que dé el 
sujeto. Asimismo, existe una razón fija de respuestas para los reforzamientos: una 
respuesta por reforzador. Por tanto, el reforzamiento continuo posee una razón 
fija de 1. 

En un programa de reforzamiento continuo, es característico que los sujetos 

respondan con una tasa estable y moderada. Sólo se producen pausas breves e 
impredecibles. Una rata, por ejemplo, presionará una palanca continuamente al 
principio, y después irá disminuyendo la frecuencia conforme se vaya saciando. Es 
muy diferente la tasa de respuestas que tiene lugar cuando se utiliza un patrón de 
razón fija intermitente. La figura 6.1 proporciona uma muestra de registro acumu- 
lativo. La presentación de una recompensa viene indicada en el registro por 
pequeñas desviaciones de la pluma hacia abajo. Como puede verse, el anima! deja 
de responder después de cada reforzamiento. Sin embargo, cuando el sujeto 
reanuda las respuestas, lo hace con una tasa alta y estable. Así pues, las respuestas 
de un programa de razón fija tienen dos características, La rasa de respuestas cero 
que ocurre justo después del reforzamiento se, llama pausa postrrefOfzAamicnto. 
La tasa. de respuestas alta y. estable que. completa dl lia. z 
“ca rrera.de la razón. Si el requisito de la razón se aumenta un poco (de RF 15 a 
RE 30, por ejemplo), la tasa de respuestas durante la carrera de la razón no 
cambia. Sin embargo, con requisitos de razón más altos la pausa postrreforza- 
miento es más larga. Si el requisito de razón se aumenta de repente mucho (de 
RF 15 a RE 100, por ejemplo) es probable que el animal se detengá periódica- 
mente antes de completar el requisito de razón. Este efecto se llama tensión de la 
razón. En casos extremos la tensión puede ser tan grande que el animal deje de 
responder por completo. Cuando se entrena a un organismo, se debe tener cui- 
dado de no incrementar con demasiada rapidez la razón (o, dicho en términos 
más generales, la dificultad de la tarea), pues se puede superar la tensión de la 
razón, y el organismo puede dejar de funcionar totalmente. 

La pausa postrreforzamiento en los programas de razón fija es el resultado del 
número predeciblemente alto de respuestas que se necesitan para la siguiente 
presentación del reforzador. Cuando ya tiene suficiente experiencia con un pro- 
grama de razón fija, el sujeto aprende que después del reforzamiento tiene que 
dar un número determinado de respuestas para recibir el siguiente reforzador. 
Este efecto de la predictibilidad puede eliminarse variando el número de respues- 
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fas necesarias para un. reforzamiento de una ocasión a la siguiente. Ese procedi- 
miento es todavía un programa de razón porque el reforzamiento depende del 
número de respuestas que dé el sujeto. Sin embargo, se requiere un número de 
respuestas diferente para la entrega de cada recompensa. Ese procedimiento se 
¿Jenomina programa de razón variable. Podemos, por ejemplo, pedir al sujeto 
que dé diez respuestas para ganar la primera recompensa, trece para ganar la 
segunda, siete para la siguiente, y así sucesivamente. El valor numérico del pro- 
grama de razón variable indica el número medio de respuestas que se necesitan 
por reforzamiento. Así, nuestro procedimiento sería un programa de razón varia- 
ble 10 (abreviado, RV 10). Dado que en un programa de razón variable el 
número de respuestas requeridas por reforzamiento ya no es predecible, la tasa de 
respuestas no presenta pausas predecibles. El sujeto responde con una tasa bas- 
tante estable hasta que se sacia (véase la figura 6.1). 

Los programas de razón variable los encontramos en la vida diaria siempre 
que se precisa una cantidad impredecible de esfuerzo para obtener un reforzador. 
Cada vez que un supervisor, durante su ronda, entra en una habitación, sabe que 
será necesario limpiarla, pero'no sabe exactamente lo sucia que estará la habita- 
ción. Los jugadores de máquinas de monedas están también respondiendo a un 
programa de razón variable. Tienen que jugar varias veces a la máquina para 
ganar. Sin embargo, no saben cuántas partidas se necesitan para la combinación 
ganadora. En los deportes también son corrientes los programas de razón varia-' 
ble. Por ejemplo, siempre se precisa un cierto número de golpes para hacer un 
hoyo en el golf. Sin embargo, al comenzar, los jugadores no pueden nunca estar 
seguros de los golpes que van a necesitar. 


RV 


-— Reforzamiento 


TF 


Respuestas acumulativas 





Tiempo 


Figura 6.1. —Patrones de los registros acumulativos de presión de palanca en distintos programas de 

reforzamiento simple. En estos registros, el desplazamiento en horizontal indica el paso del tiempo, y 

el desplazamiento en vertical las respuestas acumulativas. Las marcas oblicuas indican cuándo se libera 

el reforzador. REC es reforzamiento continuo; RE, razón fija; RV, razón variable; IF, intervalo fijo, e 
IV, intervalo variable. (Datos hipotéticos.) 
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Programas de itervalo 


El reforzamiento no siempre depende únicamente de la cantidad de esfuerzo o 
del número de respuestas que dé el sujeto. Algunas, respuestas.se .refuerzan sola- 
mente si ocurren en unos momentos determinados. Los programas de. intervalo 
de reforzamiento ilustran. este tipo de situación. En un programa de intervalo 
simple, una respuesta se refuerza sólo si se realiza transcurrida una determinada 
cantidad de tiempo a partir de la última presentación del reforzador. E r 
grama de intervalo fijo, la.cantidad de tiempo es constante € de una, ocasión, a la 


ti ti 





APARTADO 6,1. La pansa postrreforzamiento, la dilación 
y «empollar» para los exámenes 


La pausa postrreforzamiento que tiene lugar en los programas de razón fija y razón 
variable es una experiencia humana muy común. En los programas de razón fija se pro- 
duce la pausa porque se necesita siempre un número previsiblemente alto de respuestas 
para obtener la recompensa siguiente. En un sentido, el animal está «guardándose» antes 
de embarcarse en el gran esfuerzo necesario para el reforzamiento. Un aplazamiento sími- 
lar es típico en la conducta humana. Considérese, por ejemplo, un trimestre del curso 
académico en el que tenemos que tealizar varios trabajos escritos. Es probable que haga- 
mos los trabajos uno por uno. Sin embargo, cuando completamos uno, es muy probable 
que no empecemos inmediatamente a trabajar en el siguience. Más bien, habrá una pausa 
postrreforzamiento. Después de completar un trabajo escrito largo, las personas tienden a 
tomarse algo de tiempo antes de comenzar la tarea siguiente. De hecho, la dilación entre 
tareas o antes del comienzo de un nuevo trabajo es la regla más que la excepción. Los 
resultados de laboratorio ofrecen una sugerencia para superar esa dilación. La actuación en 
un programa de razón fija indica que una vez que los animales inician la carrera de la 
razón, responden con una tasa alta y estable hasta que completan el requisito de la razón. 
Esto sugiere que si de algún modo tuviéramos que emprender una tarea, lo más probable 
es que no nos résultara dificil seguir trabajando hasta acabarla. Sólo el comienzo es duro. 
Una técnica que funciona bastante bien para ponernos en acción es decirnos a nosotros 
mismos que vamos a empezar únicamente con una parte pequeña de la tarea nueva, Si 
estamos intentando hacer un escrito, nos diremos a nosotros mismos que para empezar 
sólo vamos a escribir un párrafo. Nos podemos encontrar muy fácilmente con que una vez 
que hemos completado el primer párrafo, resulta mucho más sencillo escribir el segundo, 
luego el siguiente y así sucesivamente. Si estamos posponiendo hacer una limpieza general, 
no pensemos en realizar todo el trabajo. En vez de eso, empecemos con una pequeña 
parte, como por ejemplo, fregar el suelo de la cocina. El resto ya vendrá más fácilmente. 

En un programa de intervalo fijo, las pausas postrreforzamiento pueden ocurrir por- 
que, una vez que se entrega una recompensa, no existen probabilidades durante un tiempo 
de que haya otro disponible. La programación de los exámenes en los cursos de la facultad 
se asemeja a un programa de intervalo fijo. En muchos cursos existen pocos exámenes, y 
se distribuyen de manera uniforme a lo largo del curso. Puede haber un examen a mitad de 
curso y un examen final. El patrón de estudio que ese programa mantiene es muy similar a 
lo que se observa en el laboratorio. No se estudia nada al comienzo del semestre o inme- 
diatamente después del examen. Muchos estudiantes comienzan a estudiar aproximada- 
mente una semana antes de cada examen, y la tasa de estudio aumenta rápidamente con- 
forme se acerca el día del examen. Estudiar al comienzo del curso o después del examen 
parcial no se refuerza en estos casos con buenas notas en el examen. Por tanto, los estu- 
díantes no estudian en esos momentos del curso. Una frecuencia mayor en el estudio puede 
estar motivada por una frecuencia mayor de exámenes, Se produciría una tasa más alta de 
respuestas si se hicieran con frecuencia exámenes sin previo aviso, de forma análoga a los 
programas de intervalo variable. Esta es la técnica del «control por sorpresa». 








206 MICHAEL DOMJAN Y BARBARA BURKHARD 


SIBHIENLE.' Considérese, por ejemplo, un programa de intervalo fijo de 2 min (IF 2 
min) para presionar la palanca en las ratas. Los animales expuestos a este pro- 
grama siempre son reforzados por la primera respuesta que dan transcurridos dos 
minutos desde la última recompensa. Dado que las respuestas que se ejecutan 
poco después de la entrega de la recompensa no son nunca reforzadas, en un 
programa de intervalo fijo los animales aprenden a esperar a dar la respuesta 
instrumental hasta.el momento en que se aproxima el final del intervalo fijo de 2 
min (véase la figura 6.1). Se dan muy pocas respuestas al principio del intervalo 
posterior a la recompensa. Cuando se acerca el momento de la disponibilidad del 
siguiente reforzador, la tasa de respuestas aumenta. El animal responde con una 
tasa al final del intervalo de 2 minutos y, por tanto, recibe el reforzador en cuanto 
acaban los dos minutos. Se produce una curva en el registro acumulativo cuando 
el animal acelera las respuestas al final del intervalo. Se ha acordado denominar 
festón del intervalo fijo al patrón de respuesta que se desarrolla con los progra- 


mas de reforzamiento de intervalo fijo. Es importante entender que un programa 
de reforzamiento de intervalo fijo no asegura que el animal ya a ser reforzado a 


intervalos de tiempo fijos. Así, ea un programa IF 2 min las ratas no reciben 
automáticamente el reforzador cada dos minutos. En los programas de intervalo 
es necesario que se dé la respuesta instrumental para presentar el reforzador. El 


- intervalo sólo determina el momento en el que el reforzador está disponible. Para 


recibir el reforzador cuando está disponible, los sujetos tienen todavía que dar la 
respuesta instrumental. 

Se encuentran programas de intervalo fijo en situaciones en las que se 
requiere una cantidad de tiempo fija para preparar o establecer un reforzador. 
Considérese, por ejemplo, el lavado de ropa en una lavadora. Se necesita una 
cantidad de tiempo para completar un ciclo determinado de lavadora. Por muchas 
veces que abramos la lavadora antes de transcurrido el tiempo necesario, no se 
nos reforzará con la ropa limpia. Una vez que el ciclo ha terminado, el reforzador 
está disponible y podemos recoger la ropa en el momento que queramos a partir 
de entonces. La elaboración de gelatina nos ofrece otro ejemplo. Después de mez- 
clar los polvos con agua caliente, tiene que dejarse enfriar una determinada canti- 
dad de tiempo para obtener la gelatina propiamente dicha. Para que la gelatina se 
pueda comer hay que esperar. No importa las veces que abramos la nevera para 
ver si la gelatina ha conseguido ya la consistencia adecuada, mientras no trans- 
curra el tiempo preciso. Si estamos particularmente ansiosos por comer la gela- 
tina, la tasa de respuestas de abrir la puerta de la nevera será similar a un festón 
TE. | 

Como ocurre con los programas de razón, los programas de intervalo pueden 
ser impredecibles. Eg na programa-de. interyalo: variable,.el reforzador. se. sugai- 
_Nistra Cuando s se da la primera, respuesta, después de que transcurra usa. cantidad, 


ny E 


“variable de tiempo « desde el reforzador anterior. Podemos, por ejemplo, establecer 
un “programa en el que se entregue una recompensa cuando el animal da una 
respuesta pasados cuatro minutos después de la última recompensa, el siguiente 
reforzador cuando se dé la primera respuesta pasados cinco minutos, y el 
siguiente cuando hayan transcurrido al menos tres minutos. En este procedi- 
miento, el intervalo medio que tiene que pasar antes de que estén disponibles las 
recompensas sucesivas es de cuatro minutos. Por tanto, el procedimiento es un 


programa de intervalo variable de 4 min (abreviado, IV 4 min). Como los pro- 
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gramas de razón variable, los programas de intervalo variable mantienen tasas 
continuas y estables de respuestas, sin pausas (véase figura 6.1). 

Los programas de intervalo variable se encuentran en situaciones en las que se 
necesita una cantidad de tiempo impredecible para preparar o establecer el refor- 
zador. Un mecánico que no puede decirnos cuándo va a estar arreglado nuestro 
coche nos impone un programa de intervalo variable. Tenemos que esperar una 
cierta cantidad de tiempo antes de que se nos refuerce nuestro intento de conse- 
guir el coche. Sin embargo, la cantidad de tiempo invertida es impredecible. Los 
radiotaxis están controlados también por programas de intervalo variable. Una 
vez que el coche ha completado el viaje, está disponible para otro trayecto, y la 
persona que da el mensaje por radio queda reforzada. Sin embargo, una vez que al 
taxi se le asigna un viaje, deja de estar disponible por un período de tiempo 
impredecible, durante el cual la persona que da los recados por radio no puede 
utilizar el mismo taxi para otros viajes. 

En los programas de intervalo simple, una vez que la recompensa está dispo- 
nible, el sujeco puede recibirla en cualquier momento a partir de entonces, con tal 
de que dé la respuesta requerida. En un programa de intervalo fijo de dos minu- 
tos, por ejemplo, la recompensa está disponible dos minutos después del refor- 
zamiento anterior, Si el animal responde en ese momento exactamente, se le 
refuerza. Si espera para responder hasta noventa minutos después del reforza- 
miento anterior, todavía conseguirá la recompensa. Fuera del laboratorio, en los 
programas de intervalo, es más normal que los reforzadores estén disponibles 
solamente por períodos de tiempo limitados. Considérese, por ejemplo, una cafe- 
tería en la que sólo se sirven comidas a unas horas determinadas. El hecho de ir a 
la cafetería sólo se nos refuerza si esperamos el tiempo suficiente desde la última 
comida. Sin embargo, una vez que la comida siguiente está disponible, tenemos 
una cantidad de tiempo limitada para conseguirla. Esta clase de restricción del 
tiempo que está disponible la recompensa se llama duración limitada. Lás rés- 
tricciones por duración limitada se pueden aplicar tanto a los programas de inter- 
valo fijo como a los de intervalo variable. | 


Comparación de los programas de razón con los de intervalo 


Existen semejanzas notables entre los patrones de respuesta mantenidos con 
programas simples de razón y. de intervalo. Como hemos visto, tanto los progra- 
mas de razón fija como los de intervalo fijo producen una pausa predecible en las 
respuestas después de cada reforzamiento. Por el contrario, los programas de 
razón variable y los de intervalo variable mantienen tasas estables de respuestas, 
sin pausas predecibles. A pesar de estas semejanzas, existe una diferencia muy 
importante entre los programas de razón y los de intervalo. Esta diferencia tiene 
que ver con el grado hasta el cual la aparición de las respuestas determina la 
frecuencia con que los sujetos son reforzados. En los programas de razón se da 
una relación fuerte y directa entre la tasa de respuestas y la frecuencia del refor- 
zamiento. Dado que el único factor que determina si el sujeto va a ser reforzado 
es el número de respuestas que ejecuta, la tasa de respuestas determina total- 
mente la frecuencia del reforzamiento. Cuanto más, a menudo, responda el sujeto, 
más a menudo obtendrá el reforzamiento. Esta relación hace que los programas 
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de razón sean extremadamente motivantes. El programa lleva al sujeto a respon- 
der a tasas altas porque cada respuesta le acerca a la recompensa decisiva. 

En los programas de intervalo, las tasas de respuestas no determinan la fre- 
cuencia del reforzamiento de la misma forma que en los programas de razón. 
Considérese, por ejemplo, un programa de intervalo fijo de dos minutos. Cada 
recompensa está disponible dos minutos después de la anterior. El sujeto res- 
ponde en seguida cuando se establece la recompensa, ésta se entrega y comienza 
el ciclo siguiente. Sin embargo, cualquiera que sea la frecuencia con la que el 
sujeto responda, nunca se reforzará más de una vez cada dos minutos. Por tanto, 
el programa de intervalo establece un límite máximo en la frecuencia de los 
reforzadores que el sujeto puede obtener. En el ejemplo del IF de 2 min, el límite 
es de 30 reforzadores por hora. Si los sujetos no responden en cuanto la recom- 
pensa está disponible, no obtendrán reforzadores con toda la frecuencia que sería 
posible. Por tanto, la tasa de respuestas determina en un sentido la frecuencia del 
reforzamiento. Sin embargo, la entrega de la recompensa depende más de cuándo 
responde el sujeto que dé la frecuencia con que lo hace. 

Dado que la tasa de las respuestas no determina totalmente la frecuencia del 
reforzamiento en los programas de intervalo, resulta habitual que estos progra- 
mas no motiven tasas de respuesta tan altas como los programas de razón, aun 
cuando los sujetos reciban el mismo número de reforzamientos en los dos tipos 
de programas. En un experimento importante sobre este tema, Reynolds (1968) 
comparó la tasa de picoteo de una tecla en palomas reforzadas con programas de 
razón variable y de intervalo variable. Las dos palomas fueron adiestradas para 
picotear una tecla y así obtener el reforzamiento. Uno de los pájaros fue refor- 
zado con un programa de razón variable. Por tanto, la frecuencia del reforza- 
miento para este animal venía determinada enteramente por la tasa de respues- 
tas. El otro animal fue reforzado con un programa de intervalo variable. Sin 
embargo, la disponibilidad del reforzador para este animal estaba controlada por 
la conducta de la otra paloma. Cada vez que a la paloma de la razón variable le 
faltaba sólo una respuesta para llegar al número de respuestas requerido, el expe- 
rimentador reforzaba la respuesta siguiente que daban ambos sujetos. Así pues, el 
pájaro de la razón variable controlaba el programa de intervalo variable de su 
pareja. Este procedimiento de acoplamiento aseguraba que la frecuencia del refor- 
zamiento era virtualmente idéntica para los dos sujetos. 

La figura 6.2 muestra el patrón de respuestas que desplegaba cada sujero. Aun 
cuando los dos sujetos recibían los reforzadores con la misma frecuencia, se com- 
portaban de manera muy distinta. La paloma reforzada en el programa de razón 
variable respondió con una tasa mucho más alta que la paloma reforzada con un 
programa de intervalo variable. El programa de razón variable motivaba una 
conducta instrumental mucho más vigorosa (véase también Peele, Casey y Silber- 
berg, 1984). 

Fuera del laboratorio, los programas de razón motivan también tasas de res- 
puestas más altas que los programas de intervalo. Los médicos, por ejemplo, 
normalmente trabajan de una forma que tiene características muy claras de pro- 
gramas de razón. Cuantos más pacientes ven, más dinero ganan. Cada paciente al 
que rehúsan ver les supone una pérdida de ingresos. Esta relación directa entre 
la tasa de respuestas y la tasa de reforzamiento puede contribuir a su diligencia. 
Dado que los programas de reforzamiento con características de razón requieren 
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un ímpetu fuerte en las respuestas, los empleados suelen resistirse ? esos pro: 
gramas. En las negociaciones entre la patronal y los trabajadores, la patronal, 
probablemente, querrá imponer características de razón en el comerato, mientras 
que los representantes de los trabajadores insistirán en que se establezcan las 


características de un programa de intervalo. 







Tasa RV = 
5 respuestas/seg 


Tasa IV = 
1 respuesta/seg 


100 
respuestas 


Reforzamiento 1 min 


j i da con un programa de razón variable 
2 —Registros acumulativos de dos palomas, una reforza as 
a otra Sometida a un programa de intervalo variable (TV). Aunque los sujetos recibieron el 


á] í rapi- 
mismo número de reforzamientos y en los mismos momentos, el pájaro RV respondía con, una rap 
dez cinco veces mayor que 


la del pájaro 1V. (Según Reynolds, 1968.) 
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PROGRAMAS DE REFORZAMIENTO DE LA TASA DE RESPUESTAS 


Como ya se ha visto, los programas de reforzamiento de razón fomentan en 
los sujetos tasas de respuestas más altas que los programas de intervalo. Sin 
embargo, ninguno de los programas exige que los sujetos actúen con una tasa 
especifica para ser reforzados. Por tanto, las diferencias que se observan en la tasa 
de respuestas son un efecto indirecto de los programas. Por el contrario, otros 
procedimientos exigen especificamente que. los sujeros..respondan con una tasa 
concreta para ser reforzados. Esos procedimientos se denominan programas de 
reforzamiento de la tasa de respuestas. 

En los programas de tasa de respuestas, el que uma respuesta se refuerce 
depende de lo que tarde en producirse después de la respuesta anterior. El ínter- 
valo entre las sucesivas respuestas se llama tiempo interrespuesta, de forma 
abreviada, TIR. Se podría establecer, por ejemplo, un programa de reforzamiento 
en el que una respuesta se reforzara sólo si se presenta antes de cinco segundos 
desde la última respuesta. Si el sujeto da una respuesta cada cinco segundos, su 
tasa de respuestas será de 12 por minuto. Así pues, el programa suministra refor- 
zamiento si la tasa de respuestas es 12 por minuto o mayor. El sujeto no será 
reforzado si su tasa de respuestas es menor de 12 por minuto. Como puede supo- 
nerse, este procedimiento fomenta las tasas altas de respuestas. Por tanto, se 
llama reforzamiento diferencial de tasas altas, o RDA. 

En los programas RDA, una respuesta se refuerza sólo si aparece dentro de: 
un período determinado de tiempo posterior a la última respuesta. Se consigue el 
resultado contrario si se refuerza una respuesta sólo cuando.se.. presenta pasado 
este determinado período de tiempo. Este tipo de procedimiento se llama refor- 
zamiento diferencial de tasas bajas, abreviado, RDB. Como es de suponer, los 
programas de RDB fomentan que los sujetos respondan lentamente. 

Los programas de tasas de respuestas se encuentran fuera del laboratorio en 
situaciones que requieren tasas de respuestas concretas. Una cadena de montaje 
nos proporciona un buen ejemplo. La velocidad de movimiento de la cadena es la 
que determina la tasa de respuestas de los trabajadores. Si un trabajador responde 
más lentamente que la tasa especificada, no se le refuerza y puede, de hecho, ser 
despedido. Sin embargo, los trabajadores tienen que tener cuidado de no trabajar 
demasiado rápido, pues existe una presión social impuesta por los compañeros de 
trabajo. Los que respondan con tasas demasiado altas se pueden ganar la enemis- 
tad de sus compañeros. La presión social en algunas situaciones de trabajo 
refuerza de forma diferencial las tasas bajas de respuestas. 


PROGRAMAS CONCURRENTES: EL ESTUDIO DE LA CONDUCTA 
DE ELECCION 


Los programas de reforzamiento que se han discutido hasta ahora contenían 
un análisis de la relación entre la aparición de una respuesta concreta y el refor- 
zamiento de esa respuesta. Sin embargo, el estudio de las situaciones en que sólo 
se está midiendo una respuesta probablemente no nos proporciona una compren- 
sión total de la conducta. La conducta animal y humana implica mucho más que la 
simple repetición de respuestas individuales. Incluso en una situación simple, 
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como la caja de Skinner, los organismos toman parte en una gran variedad de 
actividades y, continuamente, están haciendo elecciones entre las distintas res- 
puestas que son capaces de realizar. Además, la aparición de una respuesta con- 
creta depende mucho más de la disponibilidad de otras respuestas alternativas. 
Un adolescente puede cortar el césped de sus vecinos por 2.000 pesetas si el cielo 
está nublado y sus amigos se han ido de la ciudad. Sin embargo, si la temperatura 
es buena y sus amigos están en casa, es más probable que pase la tarde en la playa 
con ellos. Tenemos que estar constantemente eligiendo qué hacer. ¿Deberíamos ir 
al cine O quedarnos en casa a estudiar? ¿Deberíamos ir de compras hoy o ver la 
televisión hoy e ir de compras mañana? Entender los mecanismos de la elección 
de respuestas es fundamental para la comprensión de la conducta, porque las 
elecciones que los organismos hacen determinan la aparición de las respuestas 


individuales. 

Las elecciones que están al alcance de los animales y el hombre son muy 
complejas. Por ejemplo, una persona puede hacer una elección de doce respuestas 
diferentes (leer el periódico, ver la televisión, ir a dar un paseo, jugar con el 
perro, etcétera), cada uña de las cuales da lugar a un reforzamiento diferente de 
acuerdo con un programa de reforzamiento diferente, Analizar todos los factores 
que controlan la conducta individual sería una tarea formidable si no imposible. 
Por tanto, los psicólogos han empezado las investigaciones experimentales de los 
mecanismos de la elección estudiando situaciones más simples. La situación de 


APARTADO 6.2. El wso de los programas RDB en la valoración 


neuropsicológica 


Las técnicas conductuales desarrolladas a lo largo de la investigación sobre el aprendi- 
zaje animal se utilizan ampliamente en la investigación neurofisiológica. Los efectos psico- 
lógicos de distintos tratamientos fisiológicos, como la administración de drogas, las lesio- 
nes cerebrales, las estimulaciones cerebrales y los cambios dietéticos, se evalúan, a menudo, 
por los efectos que tienen esos tratamientos sobre los parromes de respuesta mantenidos 
por programas concretos de reforzamiento. Oscar-Berman (1980), por ejemplo, utilizó 
programas RDB para evaluar los déficits neurofisiológicos que se producían en la enfer- 
medad de Korsakoff. El síndrome de Korsakoff es un conjunto de desórdenes neurológicos 
y psicológicos que en los humanos puede provenir del uso prolongado y excesivo de alco- 
hol. En dos pacientes con Korsakoff el déficit psicológico más obvio es la pérdida de la 
memoria de hechos recientes. Oscar-Berman se ha interesado por saber hasta qué punto 
este déficit de la memoria es secundario a otros problemas. Planteó la hipótesis de que el 
deterioro neurológico en los pacientes de Korsakoff les hace resporider prematuramente a 
la información que les llega, que «hacen una salida en falso». Para evaluar esta hipótesis, 
Oscar-Berman utilizó un programa de RDB porque el reforzamiento en un programa de 
RDB depende de que se espere el tiempo preciso entre respuestas, de no «adelantarse». Se 
realizó la prueba con tres grupos de personas: normales, alcohólicos que no tenían la 
enfermedad de Korsakoff y pacientes de Korsakoff. Los sujetos fueron colocados ante un 
panel con una palanca prominente para dar las respuestas. Las respuestas con la palanca se 
reforzaban con peniques según distintos programas de RDB (RDB de 3 seg, de 6 seg, de 
12 seg y de 18 seg). De acuerdo con la predicción, en los programas RIDB los pacientes de 
Korsakoff fueron mucho menos capaces que las personas normales de esperar el tiempo 
suficiente para conseguir reforzamiento. Otro hallazgo interesante [ue que la acuación de 
los alcohólicos que se consideró que no padectan la enfermedad de Korsakoff era la inter- 
media entre las actuaciones de los otros dos grupos. Una interpretación posible de esos 
resultados es que los déficits en las actuaciones con RDB son las primeras señales de aviso 
de un deterioro neurológico previo a la enfermedad de Korsakoff. 
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Programa A 
IV 60 seg dera 5 Figura 6.3.—Diagrama de un 


Programa concurrente. Los pico- 
tazos en la tecla A son reforza- 
dos de acuerdo a un programa 
de reforzamiento IV de 60 sep. 
Los picotazos en la tecla B son 
reforzados de acuerdo a un pro- 
grama de reforzamiento RE 10. 





E más simple es aquella en que el sujeto tiene dos res puestas alternativas y 
a va seguida de un reforzador de acuerdo con un patrón de 
- Históricamente, gran parte de la investigación se ha llevado a cabo con labe- 
HIAOS, concretamente laberintos en T. La elección pueden medirse por la frecuen- 
cia con que los sujetos tuercen a la derecha o a la izquierda. En un artículo ya 
clásico titulado «Los determinantes de la conducta en el punto de elección» Tol. 
man (1938) avanza el argumento de que toda conducta es esencialmente un 
conducta de. elección. La elección puede ser entre una respuesta u otra o e 
simplemente, responder o no responder (véase en Woodworth y Schlosber 
1954, una buena revisión de los experimentos de elección que usan laberinto A 
a. s en 
Enfoques más recientes del estudio de la elección utilizan cajas de Skinner 
equipadas con dos manipuladores, como, por ejemplo, dos palancas. En el expe- 
rimento tipico, las respuestas en cada manipulador se refuerzan con un Peon de 
reforzamiento distinto. Los dos programas actúan a la vez, y el sujeto es libre de 
pasar de un manipulador a otro. Esta clase de procedimiento se llama programa 
concurrente de reforzamiento. Los programas concurrentes de eS 
permiten medidas continuas de la elección porque el sujeto es libre de cambiar de 
una alternativa de respuesta a la otra. La preferencia (la elección) se mide por la 
tasa de respuestas en cada manipulador o por el tiempo que el sujeto a - 
pondiendo en cada una de ellas. Ñ is 
La figura 6.3 muestra un ejemplo de programa concurrente con palomas. La 
cámara experimental tiene dos teclas para responder. Si la paloma picotea en la 
tecla de la izquierda recibe reforzadores de comida según un programa de inter- 
valo variable de 60 segundos. Los picotazos en la tecla de la derecha producen 
reforzadores de comida según un programa de razón fija de 10. El animal es libre 
de picotear cualquier tecla en cualquier momento. El punto importante del expe- 
rimento es véase de qué forma distribuye el animal los picotazos entre las dos 


Cc u 
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En algunos programas concurrentes, particularmente los que contienen ele- 
mentos de programa de intervalo, la paloma puede ser reforzada por el primer 
picotazo que da después de pasar de una tecla a la otra. Este reforzamiento «acci- 
dental» puede animar al animal a carabiar constantemente de una tecla a la otra. 
Para valorar los efectos de los programas concurrentes sin este reforzamiento del 
cambio, los experimentadores con frecuencia añaden la limitación de que no se 
refuerce el primer picotazo, O los dos primeros picotazos, después de un cambio. 
Esta característica se llama demora por el cambio (DPC) porque retrasa el 
reforzamiento después del cambio de una tecla de respuesta a la otra. 


Medidas de la conducta de elección | 


¡4n del animal en un programa concurrente se refleja en la distribu- 
ción de su conducta dos alternativas. de respuesta. Esto se puede medir 


. , ' > TÁ mn 
_de varias maneras. Una técnica común es calcular. la tasa relativa. de respuestas en. 


cada alternativa. La tasa relativa de respuestas en la tecla A, por ejemplo, se 
calcula dividiendo la tasa de respuestas en la tecla A por la tasa total de respuestas 
(la tasa en la tecla A más la tasa en la tecla B): TA/(TA + TB), donde TA es la 
tasa de respuestas en la tecla A y TB es la tasa en la tecla B. Si el sujeto picotea 
con la misma frecuencia en una clave que en otra la razón será 0,5. Si la tasa de 
respuestas en la tecla A es mayor que la tasa de respuestas en la tecla B, la razón 
será superior a 0,5. Si la tasa de respuestas en la tecla Á es menor que la tasa de 
respuestas en la tecla B, la razón será menor de 0,5. La tasa relativa de respuestas 
en la tecla B puede calcularse de forma comparable. 


La ley de la igualación 


Como se puede suponer, el programa de reforzamiento de cada alternativa 
tiene gran influencia en la distribución de la conducta de los sujetos entre ambas 
alternativas. Por ejemplo, si está disponible el mismo programa de reforzamiento 
de intervalo variable para las dos alternativas de respuesta, como en un procedi- 
miento concurrente de IV 60 seg IV 60 seg, la paloma picoteará las dos teclas con 
la misma frecuencia. Este resultado es intuitivamente razonable. Si la paloma 
pasara picoteando todo el tiempo en un lado, recibiría sólo los reforzadores pro- 
gramados para ese lado. El sujeto puede recibir más reforzadores picoteando en 
los dos lados. Ya que el programa de reforzamiento de IV es igual en cada lado, 
no existe ventaja alguna en pasar más rato en un lado que en el otro. 

Al responder con la misma frecuencia en cada lado del programa concurrente 
de IV 60 seg. IV 60 seg, el sujeto obtendrá también reforzadores con la misma 
frecuencia en armbos lados. La tasa relativa de reforzamiento obtenida con cada 
alternativa de respuesta puede calcularse de una manera comparable a la tasa 
relativa de respuestas. Por ejemplo, la tasa relativa de reforzamiento para la 
alternativa Á es la tasa de reforzamiento de la respuesta A dividida por la tasa 
total de reforzamiento (la suma de la tasa de recompensa obtenida en el lado A, 
más la tasa de recompensa obtenida en el lado B). Esto se expresa con la fórmula 
tA/(tA +tB), donde tÁ y tB representan las tasas de reforzamiento obtenidas en 
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cada alternativa de respuesta. En un programa concurrente IV 60 seg IV 60 seg, 
la tasa relativa de reforzamiento para cada alternativa de respuesta será de 0,5 
porque el sujeto obtiene recompensas con la misma frecuencia en cada lado. 


Efectos de las variaciones en el programa concurrente. Como hemos visto, 
en el programa concurrente IV 60 seg IV 60 seg, tanto la tasa relativa de respues- 
tas como la tasa relativa de reforzamiento para cada alternativa de respuesta es 0,5. 
Así pues, la tasa relativa de respuestas es igual a la tasa relativa de reforza- 
miento. ¿Ocurrirá esto también si las dos alternativas de respuesta no se refuer- 
zan según el mismo programa en el procedimiento concurrente? Esta importante 
cuestión fue formulada por Herrnstein (1961). Herrnstein estudió la distribución 
de las respuestas en varios programas concurrentes IV IV en los que la tasa total 
máxima de reforzamiento que el sujero podía obtener era 40 por hora. Sin 
embargo, dependiendo del valor exacto de cada programa IV, podían obtenerse en 
cada alternativa de respuesta proporciones diferentes del total de cuarenta pre- 
mios/hora. Por ejemplo, con un programa concurrente IV 6 min IV 2 min, se 
lleva a cabo un programa de 1V 6 min en la tecla de la derecha y un programa de 
IV 2 min en la tecía de la izquierda. Se podía obtener un máximo de 10 reforza- 
dores por hora respondiendo en la derecha, y un máximo de 30 reforzadores 
respondiendo en la izquierda. Herrnstein estudió los efectos de una amplia varie- 
dad de programas concurrentes IV 1V. No existían limitaciones respecto al lado 
en el que la paloma podía picotear. Podían responder exclusivamente en un lado 
si ellas lo escogían, o podían distribuir los picotazos entre los dos lados en la 
proporción que eligieran. De hecho, sin embago, las palomas distribuían sus fes- 
puestas de una manera uniforme y predecible. Los resultados, resumidos en la 
figura 6.4, indican que la tasa relativa de respuestas en una alternativa determi- 
nada se acercaba siempre mucho a la tasa relativa de reforzamiento que se obtenía 
en esa alternativa. Si las palomas conseguían una mayor proporción de los refor- 
zadores en la alternativa A, daban una proporción mayor de respuestas en la 
alternativa A. De acuerdo con estos resultados, la tasa relativa de respuestas en la 
alternativa Á es igual a la tasa relativa de reforzamientos para esa alternativa. 
Esta relación se ha encontrado en muchas situaciones y se ha considerado una ley 
de la conducta. Se llama ley de la igualación y se expresa simbólicamente del 
modo siguiente: . 


TA tÁ 
TA+TB tÁ SA cB 


donde TA y TB son las tasas de respuestas en el lado A y B, y-tA y tB son las 
tasas de reforzamiento obtenidas en cada lado. La ley de la igualación refleja un 
hecho fundamental de la conducta de elección e indica que las elecciones no se 
realizan caprichosamente, sino que están en función de las tasas relativas de 
reforzamiento. 


Condiciones de la igualación. Las tasas relativas de respuesta no siempre son 
exactamente iguales a las tasas relativas de reforzamiento en cada alternativa de 
respuesta (por ejemplo, Baum, 1979; Wearden y Burgess, 1982), y se ha dedicado 
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Figura 6.4. —Resultados obtenidos por dos palomas que picotean siguiendo programas IV TV concu- 

arentes. Cada punto representa una combinación de programas IV con la que se obriene una tasa 

combinada de reforzamiento de 40 reforzamientos por hora. Nótese que en cada punto la tasa relativa 

de respuesta prácticamente equivale (coincide) a la tasa relativa de reforzamiento. (Según Herrnsceín 
1961.) 


y 


un gran esfuerzo teórico y experimental a analizar casos excepcionales (para una 
revisión véase Williams, en prensa). Á veces, la alternativa preferida.ho se pre- 
tanclara como predice- 
una 1 gualación En. otras ocasiones-la-alternativa preferida se elige con más 
A predice, la relación.de. igualación, Estos casos ilustran una. suprai- 
xión. El análisis de los casos de infraequiparación y supraequiparación ha 

a a especificar las condiciones en que tiene lugar la igualación. 

Un factor importante para que se cumpla la relación de igualación es la inde- 
pendencia de las dos alternativas de respuesta. La independencia de las dos res- 
puestas se pierde si los sujetos son reforzados (intencionadamente o de otro 
modo) por realizar una secuencia concreta de alternancias entre las dos elecciones. 
Puede utilizarse una demora por el cambio para eliminar ese reforzamiento del 
cambio de forma que las dos alternativas de respuesta no se conviertan en com- 
ponentes de una sola unidad conductual reforzada. Una segunda variable impor- 
sante de la igualación es la dificultad o el tiempo que supone ir de una alternativa 
de respuesta a la otra. Si el cambio de una respuesta a otra es difícil o lleva 





elación de-igualación. Esos casos, ilustran. 
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mucho tiempo, los sujetos tienden a sobreigualar (a mostrar una propensión exa- 
gerada por la alternativa de respuesta que prefieren). Un tercer factor esencial 
para obtener la relación de igualación es que las dos alternativas de respuesta 
contengan la misma topografía de respuesta. La relación de ¡igualación se formula 
para los casos en que los sujetos eligen entre dos respuestas que son idénticas 
excepto en que son reforzadas con programas diferentes de reforzamiento. Si las 
alternativas de respuesta son diferentes, las fórmulas de igualación no pueden 
usarse directamente por las complicaciones que supone tratar de encontrar una 
medida común para las diversas conductas. Á pesar de esas y de otras limitaciones 
(véase Williams, en prensa), la relación de igualación ha logrado describir con 
éxito notable la conducta de elección en una amplia variedad de situaciones. 


Extensión de la ley de igualación a los programas simples de reforzamien- 
to. Si la ley de igualación refleja un hecho fundamental de la conducta, entonces 
también debería ser aplicable a las respuestas que se obtienen con programas 
simples de reforzamiento. En un programa de reforzamiento simple, se suminis- 
tra un manipulador de la respuesta (como, por ejemplo, una palanca o una tecla), 
y de acuerdo con un programa se refuerza al sujeto por las respuestas en ese 
manipulador. La ley de igualación describe la distribución de las respuestas entre 
varias alternativas. ¿Cómo puede aplicarse a las situaciones de respuesta única? 
Como Herrnstein (1970) señaló, se puede considerar que incluso las situaciones 
de respuesta única implican una elección. La elección está entre dar la respuesta 
específica (presionar la barra o picotear una tecla, por ejemplo) y realizar otras 
actividades (asearse, dar vueltas, picotear el suelo, oler agujeros de la cámara 
experimental). Los sujetos reciben reforzadores explícitos, programados por la 
aparición de respuestas operantes explícitas. Además, reciben, sin duda, recom- 
pensas intrínsecas por las otras actividades que pueden realizar. Por tanto, tiene 
que considerarse que el reforzamiento total de la situación comprende las recom- 
pensas programadas y las recompensas intrínsecas. Este análisis permite la apli- 
cación de la ley de la igualación a los programas de reforzamiento de respuesta 
única. Considérese que TA representa la tasa de la respuesta operante específica 
del programa, To la tasa de las otras actividades del animal, tA la tasa del refor- 
zamiento explícito programado, y to la tasa del reforzamiento intrínseco de las 
otras actividades. La ley de la igualación para las siruaciones de respuesta única 
puede establecerse del modo siguiente: 


TA ta 


TA + To tÁ + to 


Aplicando matemáticamente una variación de esta ecuación a los datos de un 
programa de respuesta única, Herrnstein proporciona pruebas de que la ley de la 
igualación se cumple en esas situaciones. 


La igualación y el concepto del valor del reforzamiento. La distribución de 
las respuestas que el organismo ejecuta no sólo se iguala a las tasas relativas de 
reforzamiento que obtiene en las alternativas de respuesta, sino también con 
otras características del reforzamiento. Catania (1963), por ejemplo, varió la can- 
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tidad de reforzamiento disponible para las respuestas en cada una de las dos 
alternativas en un programa concurrente. Halló que las tasas relativas de res- 
puesta que daba el sujeto en cada alternativa eran iguales a la magnitud relativa 
del reforzamiento que podían obtener en las alternativas. Esta relación puede 
expresarse: 


TA CA 
TA+TB_ CA+CB 


donde TA y TB son las tasas de respuesta en las alternativas A y B, y CA y CB 
son las cantidades de recompensa obtenidas por las respuestas en A y en B, res- 
pectivamente. Se ha encontrado que también existe igualación cuando se retrasa 
el reforzamiento. En determinadas circunstancias, la tasa relativa de respuesta 
para una de las dos alternativas es igual a la inmediatez relativa del reforzamiento 
que se obtiene en esa alternativa. Cuanto más corta es la demora relativa, mayor es la 
tasa relativa de respuesta (Chung, 1965; Chung y Herrnstein, 1967; véase también 
Dunn y Fantino, 1982; Gentry y Marr, 1980; Killeen, 1968). 

Dichas características de los reforzadores, como la cantidad y la demora, se 
pueden considerar determinantes de la calidad, o valor, del reforzador. Podemos 
suponer que los sujetos prefieren que los reforzadores se presenten frecuente- 
mente, que su cantidad sea grande y que se entreguen con demoras cortas. Pode- 
mos asimismo pensar que la ley de la igualación refleja, por lo general, la iguala- 
ción de las tasas relativas de respuesta con los valores relativos de los reforzado- 
res alternativos. Además, podríamos utilizar las tasas relativas de respuesta para 
medir los valores relativos de los reforzadores. Vamos a suponer que queremos 
averiguar si dos reforzadores tienen el mismo valor para un sujeto. ¿Le gusta a 
Juan el helado de chocolate tanto como el de vainilla? Para responder a esta 
pregunta tendríamos que véase la frecuencia con que Juan come de cada sabor 
cuando se le da a elegir. Si el 50 por 100 de las veces escoge chocolate y el otro 50 
por 100 de las veces elige vainilla, podemos llegar a la conclusión que los dos 
sabores tienen el mismo valor para Juan. De forma similar, los programas de 
reforzamiento se dice que son de igual valor si el sujeto elige responder el 50 por 
100 de las veces en cada alternativa cuando los dos programas están disponibles 
simultáneamente en un procedimiento concurrente. Dado que los valores relati- 
vos de los reforzadores están determinados por las tasas relativas de respuesta, 
los valores relativos de los reforzadores no se pueden utilizar para explicar por 
qué los sujeros distribuyen sus respuestas de una forma concreta entre los refor- 
zadores alternativos. Las tasas relativas de respuesta y los valores relativos de los 
reforzadores son, simplemente, dos caras de la misma moneda. Son las dos for- 
mas en que se presenta el mismo proceso de conducta básico que interviene en la 
elección (véase Killeen, 1972; Rachlin, 1971). . 
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Mecanismos de la ley de la igualación 


La ley de la igualación describe la forma en que los sujetos distribuyen sus 
respuestas en una situación de elección, pero no explica qué mecanismos son los 
responsables de esta distribución de las respuestas. Tanto las tasas relativas de 
respuesta en las dos alternativas como las tasas relativas de recompensa obtenidas 
en esas dos alternativas de respuesta, son medidas de la conducta del sujeto. ¿Qué 
variable independiente, o factor externo, es el responsable de la conducta descrita 
en la ley de la igualación? Esta cuestión ha estimulado la experimentación y el 
debate teórico. En los últimos años se ha realizado un progreso considerable 
(véase, por ejemplo, Commons, Herrnstein y Rachlin, 1982), pero continúan sin 
resolverse muchos problemas importantes. 


Las tasas de igualación y de optimización del reforzamiento. Las explicacio- 
nes de la conducta de elección que se han investigado más ampliamente se basan 
en la idea, intuitivamente razonable, de que los animales distribuyen sus acciones 
entre las alternativas de respuesta de forma que reciben la máxima cantidad de 
reforzamiento posible en la situación. Según esta idea de optimización, van de 
una respuesta alternativa a otra de forma que reciben tantos reforzadores como 
pueden. La idea de que los sujeros logran el máximo de reforzamiento se ha 
utilizado para explicar la conducta de elección en dos niveles de análisis. Las 
teorías moleculares utilizan la idea de la optimización para explicar la conducta en 
el nivel de las respuestas individuales de elección; las teorías molares lo utilizan 
para explicar los niveles globales de respuesta más que las respuestas individuales 
de elección. 


Teorías moleculares. Según las teorías moleculares de la optimización los 
animales siempre escogen la alternativa de respuesta que tiene más probabilidad 
de ser reforzada en ese momento. Shimp (1966, 1969) propuso una primera ver- 
sión de la igualación molecular: en un programa concurrente de reforzamiento 
con dos alternativas de programa, el sujeto cambia de un programa al otro con- . 
forme aumenta la probabilidad de reforzamiento del otro programa. Considérese, 
por ejemplo, una paloma trabajando en un programa concurrente IV IV. Cuando 
la paloma picotea la tecla Á, el cronómetro que controla el reforzamiento en la 
tecla B está todavía operando. Cuanto más tiempo permanezca la paloma en la 
tecla A, mayor será la probabilidad de que transcurra el intervalo preciso para la 
tecla B y de que el reforzamiento por picotear en la tecla B esté disponible. Al 
cambiar, la paloma puede recoger el reforzador en la tecla B. Ahora, cuanto más 
tiempo siga picoteando la tecla B, más probabilidades tendrá la tecla A de estar 
preparada para el reforzamiento. Shimp propuso que la relación de igualación es 
producto del cambio de alternativa que se produce cuando la probabilidad de 
reforzamiento en la tecla de la respuesta alternativa llega a ser mayor que la 
probabilidad de reforzamiento en la tecla en la que accualmente se responde. 

Los estudios detallados de los patrones de cambio de una alternativa de res- 
puesta a otra no han confirmado siempre la teoría de la optimización molecular 
propuesta por Shimp. Algunos de estos estudios han mostrado también que es 
posible la igualación en ausencia de una optimización momentánea (por ejemplo, 
Nevin, 1969, 1979).. Otros experimentos también han suministrado pruebas 
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sólidas de que puede darse optimización momentánea con programas CONCurren- 
tes (Hinson y Staddon, 1983a, 1983b). Sin embargo, como ha señalado Williams 
(en prensa), esos experimentos se llevaron a cabo en circunstancias que 10 pro- 
ducían una relación de igualación. Por tanto, sigue sin resolverse el papel de la 
optimización molecular en la explicación de la relación de igualación. 


Teorías molares. Las teorías molares de la optimización sostienen que los 
animales y las personas distribuyen sus respuestas entre varias alternativas de 
forma que, a la larga, la cantidad de reforzamiento que obtienen sea máxima (por 
ejemplo, Rachlin, Battalio, Kage! y Green, 1981; Rachlin, Green, Kagel y Battalio, 
1976). No se especifica cuánto tiempo es «a la larga». Sín embargo, en contrapo- 
sición con las teorías moleculares, las teorías molares se centran a agregados de 
conducta que ocupan un período de tiempo, más que en respuestas individuales de 
elección. La teoría de la optimización molar se formuló originariamente para 
explicar la conducta de elección en programas cobcurrentes con elementos de 
razón. En los programas concurrentes de razón, los sujetos rara vez cambian de 
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APARTADO 63. La ley de la igualación, la conducta humana 
y la terapia de conducta 


Se ha encontrado que la ley de fa igualación y sus implicaciones se pueden aplicar a una 
gama amplia de situaciones de la conducta humana, entre las que se incluyen apretar un 
botón para obtener una recompensa en monedas, detectar señales en una pantalla en una 
tarea de vigilancia, mantener una conversación con varias personas en una sicuación de 
grupo, mantener conductas autoofensivas apoyadas por el reforzamiento social (véase, por 
ejemplo, Baum, 1975; Conger y Killeen, 1974, McDowell, 1982). Además, la ley de la 
igualación tiene implicaciones conceptuales y tecnológicas importantes para la aplicación 
de los principios del reforzamiento (McDowell, 1982). De acuerdo con la ley de la iguala- 
ción, la tendencia a dar una respuesta concreta depende no sólo de la tasa de reforzamiento 
para esa respuesta, sino también de las tasas de reforzamiento disponibles para las activi- 
dades alternativas. Esto implica que el análisis de una conducta problemática (hacer novi- 
llos en la escuela, por ejemplo) tiene que incluir no sólo la consideración de la recompensa 
disponible para esa conducta concreta, sino también de las recompensas que los sujeros 
pueden obtener de ozras formas. Así pues, la ley de la igualación sugiere que la valoración 
exacta de un problema de conducta requiere la consideración de la gama completa de 
actividades del sujeto y de las fuentes de reforzamiento. La ley de la igualación también 
sugiere técnicas nuevas para disminuir una conducta concreta no deseada y aumentar una 
conducta deseada. Según la ley de la igualación, una respuesta no deseada puede dismi- 
nuirse aumentando el reforzamiento de otras actividades, o, simplemente, aumentando la 
tasa de reforzamientos «grasis» disponibles para el sujeto. De forma inversa, la ley de la 
igualación señala que una respuesta deseada puede incrementarse disminuyendo la tasa de 
reforzamiento que se obriene por otros medios. 

Las consecuencias de la ley de la igualación para la terapia de conducta se ¡ilustran en el 
tratamiento de un hombre de veintidós años semirretardado para disminuir su conducta de 
oposición (McDowell, 1981). El individuo, periódicamente, se volvía poco cooperador, y en 
ocasiones su resistencia llegaba hasta el punto de atacar a otros. Dado el elevado potencial 
de agresión en esa situación, el castigo se consideró poco deseable para hacer descender la 
conducta opositora. La conducta poco deseable se trató con éxito introduciendo un sistema 
que permicía al sujero conseguir un reforzamiento posttivo al hacerle romar parte en una 
serie de acrividades diferentes. Podía ganar puntos realizando varias tareas educativas o de 
higiene personal, y cambiar después los puntos por dinero. Al incrementar la rasa de 
reforzamiento cuando realizaba otras actividades, la rasa de la conducta opositora descendía 
de forma significativa. 
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una alternativa de respuesta a.la otra. Más bien, eligen la alternativa de razón que 
requiere un número menor de respuestas para conseguir el reforzamiento, y res- 
ponden solamente en esa alternativa. En un programa concurrente RF 20 RF 10, 
por ejemplo, es probable que el sujeto responda solamente en la alternativa RE 
10. De esa forma lleva al máximo la tasa de reforzamiento que recibe. ¿Por qué 
trabajar en el programa RE 20 si se puede obtener el mismo reforzador con el 
mismo tipo de respuesta en un programa RE 10? 

La optimización molar predice que, en una situación concreta, los sujetos tra- 
bajarán para obtener la máxima cantidad posible de reforzamiento. Determinar si 
lo han conseguido supone determinar qué es lo que constituye un rendimiento 
óptimo. Sin embargo, un rendimiento óptimo es, con frecuencia, difícil de deter- 
minar. Qué constituye un rendimiento óptimo depende de la forma en que la 
entrega de los reforzadores esté relacionada con la conducta, o, de una manera 
más general, de la relación entre la conducta y las consecuencias retroalimentado- 


- ras provenientes del ambiente. Esta relación se denomina función retroalimenta- 


dora. La relación entre la conducta y sus consecuencias (la función retroalimenta- 
dora) es fácil de especificar en el caso de los programas de razón. Considérese, 
por ejemplo, un programa de reforzamiento de razón fija 10. El sujeto recibe el 
reforzador cada :10 respuestas. Por tanto, la tasa de reforzamiento (la retroali- 
mentación ambiental) estará relacionada directamente con la tasa de respuesta. 
Más especificamente, la tasa de reforzamiento será igual a una décima parte de la 
tasa de respuestas. Esta ecuación describe perfectamente la función retroalimen- 
tadora, la relación entre la conducta y las consecuencias provenientes del am- 
biente. Si hemos determinado (con valores comparables) la función retroalimenta- 
dora de distintos programas de razón, es relativamente fácil averiguar la estrategía 
de respuesta que, en un programa concurrente de razón, proporciona la máxima 
cantidad de reforzamiento. 

En las situaciones que implican relaciones complejas entre la conducta y las 
consecuencias retroalimentadoras ambientales es mucho más difícil de determinar 
si, 2 la larga, los sujetos están obteniendo el máximo reforzamiento posible. Consi- 
dérese, por ejemplo, el pescar en un estanque pequeño. ¿Cuál es la tasa Óptima de 
pesca? ¿Con qué frecuencia deberíamos sacar los peces para obtener a la larga el 
máximo de peces? Para responder a esta cuestión tenemos que conocer la función 
retroalimentadora que relaciona la cantidad de peces que conseguimos con la rapi- 
dez con que los sacamos. La función retroalimentadora es más bien complicada y 
difícil de determinar. Si extraemos los peces con una frecuencia alta, podemos 
vaciar en seguida el estanque, no dejando más peces de reserva para alimentar y 
crear la nueva generación. Por tanto, una tasa de pesca muy alta proporciona a la 
larga una tasa limitada de rendimiento. Si pescamos muy despacio, no tendremos 
problemas de despoblación, pero puede que tengamos también una tasa más baja 
de rendimiento de la que es óptimamente posible. Una tasa de pesca intermedia 
produciría los mejores resultados. Se tiene que conocer la función retroalimenta- 
dora para determinar con exactitud qué tasa intermedia de respuesta da lugar a la 
tasa máxima de rendimiento. 

Las evaluaciones de la optimización molar se han complicado por la dificultad 
de especificar las funciones retroalimentadoras de los distintos programas de refor- 
zamiento. En un programa de intervalo variable, por ejemplo, el reforzamiento 
depende no sólo de la aparición de una respuesta, sino también del momento en 
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que la respuesta se ejecuta. Si el sujeto da muchas respuestas inmediatamente des- 
pués de cada recompensa, recibirá pocas recompensas con una tasa alta de respues- 
tas. Por el contrario, si espera después de cada recompensa y espacia sus respues- 
tas, Obtendrá muchas más recompensas por la misma tasa total de respuestas. Por 
tanto, la distribución temporal de la conducta es importante para especificar la 
función retroalimentadora de los programas de intervalo. En los programas concu- 
rrentes, la relación entre respuestas y reforzamiento es aun más complicada. En 
este caso hay que considerar la distribución de las respuestas entre las dos alterna- 
tivas, además de sus características individuales. 

En muchas situaciones, las formulaciones de la optimización molar y de la 
igualación predicen el mismo tipo de conducta de elección. Sin embargo, ciertos 
aspectos de la conducta de elección presentan dificultades para las teorías de la 
optimización. Una dificultad aparece en los resultados de los programas concurren- 
tes de reforzamiento 1V IV, En un programa concurrente IV IV, los sujetos pueden 
obtener casi todas las recompensas disponibles en ambos programas con tal de que 
ocasionalmente prueben con cada alternativa. Por tanto, la cantidad total de refor- 
zamiento obtenido en un programa concurrente IV IV puede ser casi constante a 
pesar de que haya amplias variaciones en la manera en que los sujetos distribuyen 
su conducta entre las dos alternativas. La relación de igualación es solamente una 
de las muchas posibilidades diferentes que proporcionan tasas máximas de refor- 
zamiento. Dado que otras distribuciones de las respuestas pueden proporcionar 
cantidades similares de reforzamiento total, la optimización molar no puede expli- 
car por qué la conducta de elección se distribuye de una forma tan parecida a la de 
la relación de igualación en los programas concurrentes 1V IV, y no de cualquier 
otra forma igualmente eficaz (Heyman, 1983). 

Otro desafío a la igualación molar lo proporcionan los resultados de los estu- 
dios sobre los programas concurrentes de razón variable y de intervalo variable 
(véase una discusión detallada de esos programas en Prelec, 1982). En un pro- 
grama de razón variable, la tasa de, reforzamiento está relacionada directamente 
con la tasa de respuestas. Por el contrario, en un programa de intervalo variable, el 
sujeto sólo tiene que probar el programa de vez en cuando para obtener casi el 


máximo número de recompensas. Dadas esas diferencias entre las relaciones de . 


retroalimentación de los dos programas, para obtener un rendimiento máximo en 
un programa concurrente RV IV los sujetos debertan concentrar sus respuestas en 
la alternativa de razón variable y responder sólo ocasionalmente en el elemento de 
intervalo variable. Existen pruebas de que los animales prefieren el componente de 
RV, pero no lo manifiestan de forma tan clara como la optimización molar prede- 
cía (por ejemplo, Baum, 1981; HMerrnstein y Heyman, 1979). 


La optimización como objetivo más que como mecanismo. Como se ha visto, 
en determinadas situaciones (los programas concurrentes RV IV) la conducta de 
elección cumple la ley de la igualación aun a costa de no llevr al máximo la canti- 
dad de reforzamiento obtenido. En otras situaciones (en los programas concurren- 
tes IVTV), la conducta de elección se corresponde tanto con las formulaciones de la 
igualación como con las de optimización, pero la ley de la igualación logra predecir 
con más éxito la distribución de las elecciones que se realizan. Esos resultados 
sugieren que la optimización no es el mecanismo responsable de la relación de 
igualación (Mazur, 1981). ¿Quiere esto decir que la optimización no desempeña 
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niagún papel en la conducta de elección? No necesariamente. En ciertas situacio- 
nes los animales distribuyen sus elecciones para alcarizar el máximo reforzamiento 
sin satisfacer la relación de igualación (Hinson y Staddon, 1983a, 1983b). Por 
tanto, la optimización se tiene que considerar dentro de una explicación global de 
la conducta de elección. En condiciones naturales, los animales no pueden olvidarse 
de lograr el máximo de reforzamiento si quieren sobrevivir mucho tiempo. El 
rendimiento óptimo tiene que ser un objetivo cuando se realizan las elecciones 
entre distintas respuestas. Sin embargo, puede que no suministre los mecanismos 
de la conducta de elección (Staddon y Hinson, 1983). Es difícil imaginar todos los 
posibles beneficios que pueden obtenerse, a la larga, a través de las distintas alter- 
nativas de respuesta. Considérese de nuevo, por ejemplo, la frecuencia con la que 
deberían sacarse los peces de un estanque pequeño para alcanzar el máximo ren- 
dimiento. Podemos tener la optimización como un objetivo, pero para utilizar la 
optimización como el mecanismo que rige nuestra elección, tenemos que saber 
mucho sobre la historta natural del pez en cuestión. Tenemos que saber cuál es la 
media de vida de los peces, la edad que tienen cuando procrean, cuántas crías 
suelen tener, qué clase de comida toman y de qué forma sus necesidades alimenti- 
cias están influidas por la densidad de peces, qué predadores atacan a los peces, de 
qué manera la desaparición de los predadores está relacionada.con la densidad de 
peces, etcétera. 

Conseguir un rendimiento óptimo puede ser un objetivo en la conducta de 
elección, aun cuando los sujetos no siempre alcancen este objetivo. Varios factores 
pueden introducir «errores» que impiden un rendimiento óptimo. Las tendencias 
de respuesta, las limitaciones de la memoria y las limitaciones en la capacidad de 
procesar la información pueden llevar a la adopción de una estrategia inaproptada 
para la optimización de las respuestas y a fallos en la optimización del reforza- 
miento obtenido (por ejemplo, Staddon, 1980). Los casos en los que los animales 
fracasan estrepitosamente en optimizar el reforzamiento (por ejemplo, Mazur, 
1981) suministran pruebas contra la optimización como mecanismo de la conducta 
de elección, pero no invalidan la optimización como objetivo en las elecciones de 
respuesta. 


Mejoramiento. Si la optimización tiene que considerarse más como un obje- 
tivo que como un mecanismo de la conducta de elección, ¿qué mecanisimo es el 
responsable de la distribución de elecciones que especifica la ley de la igualación? 
Aunque todavía no se dispone de una respuesta definitiva, Herrnstein y Vaughan 
(1980; véase también Vaughan, 1981) hicieron recientemente una sugerencia inte- 


resante conocida como mejoramiento. El mejo ramiento alude-a-todo acto que hace 


a 


cambian Caliernativa para, .Dnejorar.la. tasa focal: «de-seforzamiento que € están reci- 
endo. Se supone que los ajustes en la distribución de la conducta entre las alter- 
“nativas continúan hasta que el sujeto obtiene la misma tasa local de recompensa en 
todas las alternativas. Puede demostrarse matemáticamente que cuando los sujetos 
distribuyen sus respuestas con el fin de obtener la misma tasa local de reforza- 
miento en cada alternativa, están actuando de acuerdo con la ley de la igualación. 
Por tanto, el mecanismo de mejoramiento da como resultado la igualación. 
Para ver cómo funciona el mejoramiento considérese un programa concu- 


rrente de 1Y 1 min 1V 3 min. Durante la primera hora de exposición a este pro- 
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grama, el sujeto cambiará de una alternativa a la otra y puede estar respondiendo 
un total de 30 minutos en cada elemento y obtener todas las recompensas. En un 
programa 1V 1 min, están disponibles 60 premios en una hora. Si el sujeto es 
capaz de conseguir todos ellos trabajando durante 30 minutos en el programa IV 1 
min, la tasa local de reforzamiento en el programa 1V 1 min será de 60 recompen- 
sas por 30 minutos de respuesta, o de 120 / hora. En un programa IV 3 min, en 
una hora están disponibles 20 recompensas. Si el sujeto consigue todas ellas traba- 
jando durante 30 mia en el programa de 1V 3 min, su tasa local de reforzamiento 
en el componente 1V 3 min será de 20 recompensas en 30 min, o de 40 / hora, Ya 
que la tasa local de reforzamiento en el programa IV 1 min es mucho más alta 
(120 / hora) que en el programa 1V 3 min (40 / hora), la conducta del sujeto se 
inclinará a favor de la alternativa IV 1 min. Sin embargo, si la inclinación es 
excesiva y dedica demasiado tiempo al programa de TV 1 min, escogiendo sólo muy 
rara vez el programa 1V 3 min, puede que obtenga un reforzamiento cada vez que 
picotea la tecla de IV 3 min. Esto haría que la tasa local de recompensa en la tecla 
de IV 3 min fuera superior a la tasa local de recompensa en la alternativa de IV 1 
min, con una inclinación resultante a favor del programa de IV 3 min. Tales incli- 


naciones a un lado y a otro continúan hasta que se igualan las tasas locales de 


reforzamiento obtenido. 

Todavía no se ha investigado bien el mecanismo de mejoramiento, pero 
resulta coherente con una gran variedad de aspectos de la conducta de elección 
(McSweeney, Melville, Buck y Whipple, 1983). El mejoramiento cumple los meca- 
nismos de la ley de la igualación propuestos anteriormente, en el sentido de que 
implica inclinaciones de la conducta hacia tasas de rendimiento más favorables. 
Proporciona un análisis de la conducta de elección que se sitúa entre las teorías de 
la optimización molares y las moleculares. Las teorias moleculares destacan el con- 
trol que ejerce sobre la conducta la probabilidad de reforzamiento en un momento 
concreto. Si la probabilidad momentánea de reforzamiento es superior en otra 
alternativa, se supone que el sujeto cambiará a esa alternativa en ese momento. El 


mejoramiento se establece en términos de tasa local de reforzamiento, más que en 


términos de probabilidad momentánea de reforzamiento. Así pues, los resultados 
tienen un alcance a plazo algo más largo que las teorías de la optimización molecu- 
lar. Pero mo se refiere a tasas globales de reforzamiento, como ocurre con las 
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universidad y sacar un título, o empezar un trabajo de jornada completa dejando de 
lado la universidad? No podemos andar cambiando de alternativas como ésta con 
mucha frecuencia. Además, para tomar esa decisión necesitamos considerar algo 
más que el simple gusto de asistir a unos cursos, o de llevar a cabo un trabajo. Esta 
elección implica también objetivos a largo plazo. Un título universitario puede 
capacitarnos para conseguir un trabajo con un sueldo más alto, pero requiere, en 
un primer momento, sacrificios económicos significativos. Conseguir un trabajo 
nos permitiría tener dinero antes, pero a la larga quizá no fuéramos capaces de 
ganar tanto. 

Obviamente, no podemos llevar a cabo experimentos en los que la elección 
que se presente sea como la de escoger entre la universidad o un empleo. Sin 
embargo, se pueden plantear cuestiones análogas simplificadas en los laboratorios 
animales. Por ejemplo, ¿prefiere una paloma trabajar en un programa de refor- 
zamiento RE 10 durante 15 minutos o prefiere trabajar en un programa IV 60 
seg la misma cantidad de tiempo? Se pueden obtener respuestas a esas cuestiones 
utilizando programas concurrentes encadenados de reforzamiento. En un pro- 
grama concurrente encadenado intervienen al menos dos elementos (véase fi- 
gura 6.5). En el primer elemento se permite que el sujeto elija entre dos alterna- 
tivas respondiendo en una de las dos. En el ejemplo del esquema de la figura 6.5, 
la paloma hace su elección al picotear la tecla de respuesta Á o la tecla de res- 
puesta B. El hecho de picotear la tecla A activa la alternativa A: la oportunidad de 
picotear la tecla A durante 15 min con un programa de reforzamiento FR 10, Si 
la paloma picotea la tecla B al principio del ciclo activa la alternativa B, que es la 
oportunidad de picotear la tecla B durante 15 min con un programa IV 60 seg. 
Dar respuestas en la tecla A o B durante el estadio inicial del programa no pro- 
duce reforzamiento. La oportunidad de reforzamiento sólo se presenta después de 
realizada la elección inicial y de que la paloma haya activado un elemento termi- 
nal u otro. 

El patrón de respuestas producido por el elemento terminal de un programa 
concurrente encadenado es el característico del programa de reforzamiento que 
esté actuando en ese elemento. En nuestro ejemplo, si la paloma ha activado la 
alternativa Á, su patrón de picoteo en el elemento terminal será similar al patrón 


clas de optimización: Programa Á Programa B Figura 6.5.—Diagrama de un 
teo: de reforzamiento de reforzamiento programa de concurrencia enca- 
denado. Al picotear la tecla A en 


t el dispositivo de elección, -se 
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Muchas situaciones de elección fuera del laboratorio son de este tipo. Si estamos 

cenando carne, verduras y puré de patatas, podemos cambiar de un alimento a otro 

en cualquier momento de la comida. De forma similar, podemos cambiar de unas 
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usual de respuestas en los programas ER 10.-St la paloma ha activado la alterna- 
tiva B, su patrón de picoteo en el elemento terminal será el característico de un 
programa IV de 60 seg. 

La elección del animal entre los programas de reforzamiento que tienen lugar 
en los elementos terminales de un programa concurrente encadenado se mide por 
la proporción con que elige la tecla A y la tecla B durante el estadio de elección 
inicial. La investigación ha demostrado que la conducta de elección está en gran 
parte determinada por las características generales del reforzamiento de cada uno 
de los elementos terminales. La paloma mostrará preferencia por el programa 
terminal que le proporcione más reforzamiento o que se lo entregue con más 
frecuencia. En los programas concurrentes encadenados de castigo, la paloma pre- 
ferirá el elemento terminal que proporciona castigo con menos frecuencia. Se 
puede usar el método del programa concurrente encadenado para determinar de 


qué forma se combinan los distintos aspectos del reforzamiento para influir en la. 


conducta de elección. 

Una aplicación interesante de los programas concurrentes encadenados es la 
investigación experimental del autocontrol. Como sabe cualquier persona que 
sigue una dieta, el autocontrol, a menudo, consiste en elegir la recompensa más 
grande (estar delgado) que se obtiene con retraso, en vez de la recompensa más 
pequeña que se recibe inmediatamente (comer un trozo de pastel). Cuando tene- 
mos delante de nosotros el trozo de pastel es muy difícil elegir la recompensa que 
se retrasa. Rachlin y Green (1972) montaron un laboratorio análogo de autocon- 
trol con palomas. Cuando se ofrecía a las palomas que eligieran directamente 
entre una recompensa inmediata pero pequeña o una grande con demora, las 
palomas solían elegir la recompensa inmediata y pequeña. Sin embargo, se les 
podía entrenar para que en determinadas circunstancias mostraran autocontrol, 
En la figura 6.6 se presenta el programa concurrente encadenado básico utilizado 
en esa investigación. En los elementos terminales del programa las respuestas se 
premiaban con el acceso inmediato a una pequeña cantidad de grano (alternativa 
A) o con el acceso a una cantidad grande de grano que se retrasaba cuatro segun- 
dos (alternativa B). Las palomas podían elegir entre esas dos alternativas pico- 
teando la tecla A o la tecla B durante el estadio inicial del programa. 

¿En qué circunstancias muestran las palomas autocontrol? Cualquiera que siga 
una dieta sabe que es más fácil rechazar un trozo de tarta que se va a tomar para 
merendar al día siguiente que rechazar un trozo de tarta que se va a comer dentro 
de unos minutos. En las palomas ocurría un fenómeno similar. Los sujetos tenían 
más probabilidades de elegir la recompensa grande con demora que la recom- 
pensa pequeña inmediata si los elementos terminales del programa concurrente 
encadenado se retrasaban hasta después de que las palomas hicieran su elección 
inicial. Esto se lograba exigiendo a los sujetos que respondieran diez veces en las 
teclas de elección en vez de sólo una vez durante el estadío inicial del programa. 

El fenómeno del autocontrol tal como viene ilustrado en los experimentos de 
Rachlin y Green ha estimulado la investigación y el desarrollo teórico. Al igual 
que Rachlin y Green, numerosos investigadores han hallado que las preferencias 
cambian a favor de la recompensa grande con demora cuando se hace que los 
sujetos tengan que esperar para recibir cualquier recompensa una vez que han 
elegido. Si se entregan las recompensas poco después de la respuesta de elección, 
los sujetos se inclinan a favor de la recompensa pequeña inmediata, antes que a 
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favor de la recompensa grande con demora. Sin embargo, si se añade un retraso 
constante a la entrega de las dos recompensas, es más probable que los sujetos 
muestren autocontrol y se inclinen a favor de la recompensa grande más remota. 
Este cambio en la preferencia se ha obtenido tanto con personas como con sujetos 
no humanos y, por tanto, representa una propiedad general de la conducta de 
elección (por ejemplo, Ainslie y Herrnstein, 1981; Solnick, Kannenberg, Ecker- 
man y Waller, 1980; véase también Millar y Navarick, 1984). 

Los esfuerzos teóricos para explicar la conducta de elección mediante un para- 
digma del autocontrol se han basado en la suposición de que el valor de una 
recompensa desciende en función del tiempo que hay que esperar para recibirla. 
Se supone que cuanto más tienen que esperar los sujetos para conseguir una 
recompensa, menos valor tiene la recompensa. La figura 6.7 muestra dos funcio- 
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Figura 6.6.—Diagrama del experimento de Rachlin y Green (1972) sobre autocontrol. El recuadro 
superior muestra el procedimiento de elección directa. El recuadro inferior muestra el procedimiento 
concurrente encadenado, 
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Figura 6.7.—Relación hipotética 

entre el valor de la recompensa 

y el tiempo de espera para la 

entrega de la comida, conside- 

rando una recompensa pequeña 

y otra grande presentada un 
tiempo después. 


Pequeña 


de la recompensa 


Valor 





nes de descenso hipotético de este tipo, una con una recompensa pequeña y otra 
con una recompensa grande que se presenta poco después de la recompensa 
pequeña. La figura también señala dos puntos en el tiempo, T1 y T2, anteriores a 
la entrega de la recompensa pequeña y la grande. T1 implica mucho menos 
tiempo de espera para la entrega de la recompensa que T2. Las curvas de valor de 
la recompensa que se muestran en la figura 6.7 predicen la conducta de elección 
que se observa habitualmente en los experimentos de autocontrol. Cuando el 
tiempo de espera para la entrega de la recompensa es corto (Fl en la figura 6.7), 
el valor de la recompensa pequeña es mayor que el valor de la recompensa 
grande. Así pues, los sujetos elegirán la recompensa pequefía. Por el contrario, 
cuando el tiempo de espera es largo (T2 en la figura 6.7), el valor de la recom- 
pensa grande es mayor que el valor de la recompensa pequeña, y el sujeto esco- 
gerá la recompensa grande. Así pues, el modelo de la figura 6.7 predice el cambio 
de preferencia de la recompensa pequeña a la recompensa grande con demora que 
se produce cuando se aumenta el tiempo de espera para las dos recompensas. 

Es habitual que los resultados de los experimentos de autocontrol se expresen 
en términos de curvas de valor como las de la figura 6.7. Sin embargo, no se ha 
llegado a un acuerdo en la forma exacta de las curvas. Existen pruebas que justifi- 
can las curvas de valor de la recompensa derivadas de la ley de la igualación (por 
ejemplo, Ainslie y Herrnstein, 1981; Logue, Rodríguez, Peña-Correal y Mauro, en 
prensa). Pero otros resultados (por ejemplo, Snyderman, 1983) son más difíciles 
de expresar de esta forma, y se han propuesto fórmulas alternativas para las 
curvas de valor de la recompensa (por ejemplo, Killeen, 1982). 

Las investigaciones análogas de laboratorio sugieren que logrará seguir mejor 
una dieta la persona que evite enfrentarse a recompensas pequeñas inmediatas. 
Esto es así, especialmente en el caso de las dietas, porque adelgazar es una 
recompensa que, por lo general, se retrasa mucho. Podernos añadir una demora 
en las recompensas inmediatas pequeñas de alimentos que engordan aumentando 
las respuestas necesarias para obtener comida. Si no disponemos de alimentos que 
se puedan comer en el momento, el tiempo y la energía que se necesitan para 
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obtener y preparar la comida pueden facilitar el olvido de la recompensa inme- 
diata pequeña de comer, favoreciendo la recompensa de estar delgado, (Curiosa- 
mente, investigaciones que van en otra línea también hacen esta recomendación; 
ver Schachter, 1971b.) 


LA EXTINCION 


Hasta ahora hemos discutido la forma de actuar de los organismos cuando se 
refuerzan sus respuestas de acuerdo con diversos programas de reforzamiento. 
Un problema relacionado con esto, y muy imporante, es el referido a las respues- 
tas que tienen lugar cuando el reforzamiento ya no está disponible. No existen en 
la naturaleza muchos programas de reforzamiento que sigan actuando a lo largo 
de toda la vida del organismo. Las respuestas que logran reforzamiento en un 
momento dado pueden dejar de ser eficaces cuando cambian las circunstancias. Á 
los niños, por ejemplo, se les alaba cuando hacen dibujos toscos de personas y de 
objetos, pero el mismo tipo de dibujo no se considera bueno cuando lo realiza un 
adulto. Concertar citas con alguien puede ser enormemente agradable y reforzante 
hasta que esta persona encuentra un novio o novia que deja de animarle a que 
tenga esos encuentros. El no reforzamiento de una respuesta que previamente 
había sido reforzada se llama extinción. En el libro nos hemos encontrado ante- 
riormente con la extinción en relación con el condicionamiento clásico. Allí, la 
extinción se refería a la reducción de una respuesta cuando el estímulo condicio- 
nado ya no iba seguido del estímulo incondicionado. En el condicionamiento ins- 
trumental, la extinción es la reducción de una respuesta instrumental cuando ya 
no va seguida por el reforzador. 


Efectos de los procedimientos de la extinción 


Los procedimientos de extinción instrumental —la retirada del reforza- 
miento— tienen dos clases de efectos importantes sobre el organismo. En primer 
lugar, por supuesto, el procedimiento produce un descenso gradual en la tasa de la 
respuesta instrumental, Durante la primera sesión de extinción los sujetos al 
principio puden responder rápidamente, y después van respondiendo gradual- 
mente más despacio hasta que dejan de dar la respuesta instrumental. Si al sujeto 
se le devuelve a la situación experimental al día siguiente, podría existir una 
ligera recuperación temporal en la tasa de respuestas. Á esto se le llama recupe- 
ración espontánea. Sin embargo, la cantidad de recuperación espontánea des- 
ciende a medida que se repiten las sesiones de extinción, hasta que el sujeto deja 
por completo de dar la respuesta instrumental. La figura 6.8 muestra el curso de 
una respuesta durante las primeras dos sesiones de extinción. 

Además del esperado descenso de la respuesta instrumental, los procedimien- 
tos de extinción producen efectos emocionales intensos y activación conductual. Si 
el sujeto se ha acostumbrado a recibir reforzamiento con una respuesta concreta, 
puede desagradarle sumamente, y volverle agresivo, el dejar de recibir la recom- 
pensa. Esta reacción emocional inducida por la retirada de las recompensas se 
llama frustración. La agresión provocada por la frustración que se induce con los 
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Figura 6.8.—Registro acumulati- 
Sesión 1 Sesión 2 vo de las. respuestas durante la 
primera y la segunda sesiones de 
extinción. El salto en las respues- 
tas al comienzo de la segunda 
sesión es una recuperación es- 
pontánea. (Datos hipotéticos.) 


Recuperación 
espontánea 


Respuestas acumularivas 





Tiempo 


procedimientos de extinción se ha demostrado de forma espectacular en experi- 
mentos en los que se colocan dos animales (palomas, por ejemplo) en una caja de 
Skinner (Azria, Hutchinson y Hake, 1966). A uno de ellos se le reforzó en un 
principio cuando picoteaba una tecla, mientras que al otro animal se le retenía en 
una esquina de la cámara experimental. El ave que picotea la tecla ignora por 
completo a la otra mientras se le suministra el reforzamiento. Sin embargo, 
cuando el reforzamiento cesa, es muy probable que el animal previamente refor- 
zado ataque a su inocente compañero. Se produce una agresión similar si se coloca 
en la caja de Skinner un animal disecado en vez de un animal real. (Para un 
estudio experimental de la agresión inducida a través de la extinción, véase 
Nation y Cooney, 1982.) 

Las reacciones de frustración tras la retirada de una recompensa son también 
comunes fuera del laboratorio. Cuando una máquina expendedora se estropea y 
deja de entregar las bebidas, dulces o monedas que tiene dentro, hay personas 
que abusan y golpean o dan patadas a la máquina. La frustración es corriente 
también en las relaciones interpersonales cuando una de las partes introduce la 
extinción. Si un marido está acostumbrado a tener su ropa lavada, la primera vez 
que su mujer deja de lavarle la ropa se puede enfadar mucho. Si un niño está 
acostumbrado a que sus padres le lleven al colegio en coche todos los días es 
probable que le moleste tener que ir un día andando o en autobús. Si quedamos 
todos los sábados por la noche con nuestro novio o novia, nos trastornará mucho 
que, de forma inesperada, él o ella cancele la cita. 


Determinantes de los efectos de la extinción 


El factor más importante para determinar la magnitud de los efectos conduc- 
tuales y emocionales de un procedimiento de extinción es el programa de refor- 
zamiento que se ha utilizado con la respuesta instrumental antes de que se imtro- 
duzca el procedimiento de extinción. La extinción posterior de las respuestas 
instrumentales puede estar influida por diversas características sutiles de los pro- 
gramas de reforzamiento. Sin embargo, la característica predominante del pro- 
grama que determina los efectos de la extinción es si la respuesta instrumental 
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fue reforzada cada vez que se produjo (reforzamiento continuo) o sólo algunas 
veces (reforzamiento parcial o intermitente). La mayoría de los programas de 
reforzamiento descritos anteriormente en este capítulo contienen un reforza- 
miento parcial. Hemos discutido esos programas en detalle porque el patrón de 
respuestas que se produce cuando hay un reforzamiento disponible depende 
mucho de las características especiales de cada programa. Sin embargo, la diferen- 
cia entre el reforzamiento parcial y el continuo es mucho más importante en el 
estudio de los efectos de la extinción que las diferencias entre los diversos pro- 
gramas posibles de reforzamiento parcial El hallazgo general es que la extinción 
es mucho más lenta y provoca menos reacciones de frustración sí los sujetos han 
experimentado previamente un programa de reforzamiento parcial que si han 
experimentado previamente un reforzamiento continuo (véase figura 6.9). Á este 
fenómeno se le llama efecto de extinción del reforzamiento parcial o ERP. 
El reforzamiento intermitente puede crear una persistencia notable en las 
respuestas. Los aspirantes a actor o actriz estudian mucho y persisten en su 
empeño de seguir su carrera aun cuando consigan muy pocos papeles importan- 
tes. Los jugadores habituales están igualmente a merced del reforzamiento inter- 
mitente. Las pocas veces que ganan mucho les animan a seguir jugando durante 
una serie de partidas en las que pierden. El reforzamiento parcial también se da, a 
menudo, en las relaciones interpersonales. Sí no tenemos interés en quedar con 
alguien que nos considera sumamente atractivo O atractiva, podemos aceptar sólo 
una pequeña proporción de sus invitaciones. Actuando de esta forma, estamos 
reforzando a la persona de forma intermitente, y así sólo conseguimos que per- 
sista en sus intentos de ganar nuestro favor. El reforzamiento intermitente puede 
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tener también consecuencias no deseables si los padres conceden al niño lo que y 
pide sólo después que repite su petición varias veces. Considérese, qe pee . 
un niño empujando un carrito de la compra mientras el padre era o la 
compra. El niño le pide al padre que le compre caramelos. El po e que e 
El niño lo pide una y otra vez hasta que coge una rabieta porque el p a conti- 
núa diciendo que mo. En ese momento es muy probable que el padre e para 
evitar un espectáculo violento. Al comprarle el caramelo el padre habrá reforzado 


la rabieta y, además, habrá proporcionado un reforzamiento intermitente de la 


petición repetida del caramelo. El programa de reforzamiento que el padre utilizó 
hará que en el futuro el niño realice sus peticiones de forma muy persistente y, 
además, fomentará las rabietas. 


Mecanismos del efecto del reforzamiento parcial 
sobre la extinción 


Quizá la explicación más obvia del ERP es que los animales siguen respon- 
diendo más cuando se retira la recompensa después de ua reforzamiento Intermi- 
tente que después de un reforzamiento continuo porque la retirada de la do 
pensa es más difícil de detecrar en el primer caso. Si durante el O € 
sujeto no recibe recompensa después de cada respuesta, no advierte Por al 
mente que la recompensa ha cesado. El cambio en las condiciones de re el 
miento es presumiblemente mucho mas espectacular si cesa ae E 
pués de un reforzamiento continuo. Ésta explicación del efecto el reforzamien 
parcial sobre la extinción se llama hipótesis de la discriminación. o 

Aunque la hipótesis de la discriminación da una explicación Oe 
satisfactoria del ERP, el fenómeno no es tan sencillo. En una prueba ingeniosa de 


la hipótesis de la discriminación, Jenkins (1962) y Theios (1962) adiestraron 


primero a un grupo de animales con reforzamiento parcial y a otro grupo en 
reforzamiento continuo. Ambos grupos recibieron después un período de refor- 
zamiento continuo antes de que se retirara el reforzamiento en ambos grupos 
Dado que en los dos grupos se introdujo el procedimiento de pte inmedia- 
tamente después del entrenamiento de reforzamiento continuo, era de AN 
que ambos percibieran de igual manera el cese del reforzamiento. Sin em Es 
los sujetos que inicialmente recibieron adiestramiento de reforzamiento parcia 
respondieron más durante el periodo de extinción. Estos experimentos a 
que la ventaja del reforzamiento parcial no consiste en hacer el REN le 
procedimiento de extinción más difícil de detectar. Más bien parece que los suje- 
tos aprenden algo importante durante el entrenamiento con reforzamiento pa 
cial, que no se pierde ee reciben un reforzamiento continuo antés de 
¡miento de extinción. 
e eco los organismos durante el entrenamiento de e 
parcial que les hace responder más a menudo cuando ya no están ia es de 
recompensas? Se han realizado numerosos experimentos complicados e lo 
responder a esta cuestión. Estos estudios indican que el rad e refor- 
zamiento parcial favorece la persistencia durante la extinción de dos oro 
Uno de los mecanismos que explican el efecto del reforzamiento parcial sobre ; 
extinción fue propuesta por Amsel (por ejemplo, 1958, 1962, 1967, 1979), y se le 
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ha dado en llamar teoría de la frustración. La teoría de la frustración supone que 
los animales reforzados con un programa intermitente pasan por varios estadios 
en su entrenamiento. A lo largo del reforzamiento parcial, los sujetos reciben 
ensayos reforzados y ensayos no reforzados. Por consiguiente, desarrollan expec- 
tativas conflictivas. Los ensayos reforzados les llevan a esperar reforzamiento y 
los ensayos no reforzados a no esperar reforzamiento. En un principio, la expec- 
tativa de la recompensa anima a los sujetos a seguir adelante y dar la respuesta 
instrumental, mientras que la expectativa del no reforzamiento los disuade de dar 
la respuesta instrumental. Así pues, al principio del entrenamiento se les plantea 
un conflicto acerca de lo que deben hacer. Sin embargo, en algunas ocasiones en 
que los sujetos no esperan recompensa, la ejecución de la respuesta instrumental 
puede ¡r, de hecho, seguida del reforzador. Á causa de esas experiencias, la ejecu- 
ción de la respuesta instrumental se condiciona a la expectativa de no tener 
recompensa. Según la teoría de la frustración, ésta es la clave de la persistencia en 
las respuestas durante la extinción. Dado que los animales aprenden a dar la 
respuesta instrumental sin expectativa de recompensa, los sujetos entrenados con 
reforzamiento intermitente continúan dando la respuesta cuando se introducen 
los procedimientos de extinción. Por el contrario, no existe nada en el reforza- 
miento continuo que enseñe al animal a responder cuando no espera ser refor- 
zado. Por tanto, esos sujetos dejan de responder mucho más rápido una vez ini- 
ciada la extinción. 

El segundo mecanismo importante que explica que después del reforzamiento 
intermitente se den respuestas durante la extinción, fue propuesto por Capaldi 
(por ejemplo, 1967, 1971) y se conoce como teoría secuencial. La teoría secuen- 
cial confía principalmente en los mecanismos de la memoria. Sostiene que los 
animales pueden recordar muy bien si en un pasado reciente fueron o no reforza- 
dos al ejecutar la respuesta instrumental. La teoría supone, además, que en un 
programa de reforzamiento parcial los animales aprenden a dar la respuesta ins- 
trumental cuando recuerdan que no han sido reforzados en el ensayo anterior. 
Así pues, el recuerdo de no haber sido premiados recientemente motiva a los 
sujeros para realizar la conducta instrumental. La forma precisa en la que esto 
ocurre depende en gran parte de la secuencia de ensayos reforzados (R) y no 
premiados (N) que se administran en el programa de reforzamiento intermi- 
tente. 

Considérese la siguiente secuencia de ensayos: RNNRRNR. En esta secuencia 
se premia al sujeto la primera vez que da la respuesta instrumental, no se le 
premia en las dos ocasiones siguientes, después se le premia dos veces, después 
no se le premia una, y por último se le premia de nuevo. El ensayo cuarto y el 
último son esenciales en este programa. Al sujeto se le refuerza por responder en 
el cuarto ensayo. Se supone que en este ensayo el sujeto recuerda no haber sido 
reforzado en los dos ensayos anteriores. Á causa del reforzamiento del cuarto 
ensayo, se supone que el sujeto aprende que será reforzado por responder cuando 
su memoria indique que no fue premiado en los dos ensayos anteriores. Con el 
reforzamiento del último ensayo de la secuencia se activa un mecanismo similar. 
Aquí al sujeto se le refuerza por responder cuando su memoría indica que no se le 
reforzó en el ensayo inmediatamente anterior. Con experiencias suficientes de 
esta clase, los sujetos aprenden a responder siempre que recuerden que no han 
sido reforzados en los ensayos anteriores. Este aprendizaje provoca, a su vez, 
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respuestas persistentes durante la extinción, después de un reforzamiento inter- 
mitente. Un programa de reforzamiento continuo no deja que los animales 
aprendan esa persistencia. En un programa de reforzamiento continuo, se premia 
a los sujetos cada vez que dan la respuesta instrumental. Por tanto, no pueden 
aprender que serán reforzados si responden en aquellas ocasiones en que recuer- 
den no haber sido reforzados en los ensayos anteriores. Por tanto, los ensayos no 
reforzados propios de la extinción no les motivan a seguir respondiendo. 

Algunos han considerado la teoría de la frustración y la teoría secuencial como 
explicaciones incompatibles del efecto del reforzamiento parcial sobre la extin- 
ción. Sin embargo, desde que se propusieron los dos mecanismos, se han obtenido 
gran cantidad de pruebas en apoyo de cada una de las teorías. Por tanto, no 
podemos considerar una de las teorías correcta y otra incorrecta. Más bien, las dos 
teorías señalan dos formas diferentes en que el reforzamiento parcial puede favo- 
recer las respuestas durante la extinción. En algunas situaciones un mecanismo u 
otro pueden ser operativos, y en otros casos los dos procesos podrían contribuir a 
la persistencia en las respuestas durante la extinción. 


COMENTARIOS FINALES 


El principio básico del condicionamiento instrumental es muy simple: el 
reforzamiento aumenta (y el castigo disminuye) la probabilidad futura de una 
respuesta instrumental. Sin embargo, como ya hemos visto, el análisis experimen- 
tal de la conducta instrumental puede ser más bien intrincado. Muchos aspectos 
importantes de la conducta instrumental están determinados por el programa de 
reforzamiento. Existen numerosos programas con los que las respuestas pueden 
ser reforzadas. El reforzamiento puede depender de la cantidad de respuestas que 
se han producido, del paso del tiempo o de la tasa de respuesta, y el sujeto puede 
disponer al mismo tiempo de más de un programa de reforzamiento. El patrón 
de la conducta instrumental, así como la elección entre varias alternativas de 
respuesta, viene fuertemente determinado por el programa de reforzamiento que 
se utilice. Los programas de reforzamiento determinan también hasta qué punto 
los sujetos persisten en responder cuando las recompensas dejan de estar dispo- 
nibles. Estos hallazgos diversos nos han dicho mucho sobre la forma en que el 
reforzamiento controla la conducta en una amplia variedad de circunstancias. 


Capítulo 7 
EL REFORZAMIENTO: TEORIAS Y ANALISIS 
EXPERIMENTAL 


El capítulo 7 está dedicado a la discusión detallada de los mecanismos por los 
que el reforzamiento aumenta la probabilidad futura de determinadas respuestas. 
Para empezar discutiremos algunas cuestiones fundamentales de la teoría del 
reforzamiento. Á continuación habrá una discusión sobre los tres enfoques que se 
han adoptado para elaborar una teoría del reforzamiento. El primer enfoque con- 
sidera el reforzamiento como la presentación de una clase especial de estímulo e 
intenta identificar cuáles son las propiedades especiales de los estímulos reforza- 
dores. El segundo enfoque concibe el reforzamiento como regulación conductual, y 
trata de identificar la forma en que las contingencias instrumentales producen 
una redistribución de las acciones del organismo. El tercer enfoque concibe el 
refuerzo como el proceso de selección de una respuesta a partir de ciertos tipos de 
actividades que son estimuladas por presentaciones periódicas del reforzador. 


CUESTIONES FUNDAMENTALES DE LA TEORIA DEL REFORZAMIENTO 
EL REFORZAMIENTO COMO PRESENTACION DE UN ESTIMULO 
Homeostasis fisiológica y reducción del impulso 
Motivación primaria y motivación del incentivo 
El reforzamiento sensorial 
El reforzamiento por estimulación cerebral y la motivación 
EL REFORZAMIENTO COMO REGULACION CONDUCTUAL 
Precedentes de las teorías de la regulación conductual 
La teoría del reforzamiento de Premack 
Demostración experimental 
Medidas de la probabilidad de la respuesta 
La probabilidad de la respuesta como medida del valor de la respuesta 
Probabilidad momentánea y restricciones a la respuesta reforzadora 
Punto de deleite conductual y regulación conductual 
¿De qué forma se producen los efectos del reforzamiento a través de la 
regulación conductual? 
Comparaciones entre la regulación conductual y las teorías tradicionales 
del reforzamiento 
Conceptos económicos y regulación conductual 
El aporte de trabajo 
Demandas del consumidor 
Sustituibilidad 


La importancia de los modelos económicos para la regulación conductual 
La teoría del abastecimiento óptimo y la regulación conductual 
EL REFORZAMIENTO COMO SELECCION DE LA RESPUESTA 
La conducta adjuntiva inducida por el programa 
Respuestas de ínterin y respuestas terminales 


Un modelo de reforzamiento basado en la selección de la respuesta por 
evolución 


COMENTARIOS FINALES 





Los capítulos 5 y 6 describían la forma en que los diversos tipos de manipula- 
ciones experimentales influyen sobre la conducta instrumental. Estas investiga- 
ciones han suministrado mucha información sobre las características de la con- 
ducta instrumental en una gran variedad de circunstancias. El presente capítulo 
analizará con detalle los mecanismos del reforzamiento. Vamos a considerar la 
razón de que ciertos acontecimientos sean reforzadores eficaces y qué cosas 
aprenden los organismos a lo largo del condicionamiento instrumental. Las res- 


- puestas a estas cuestiones constituyen algunos de los aspectos más importantes e 


interesantes de la teoría de la conducta de hoy. 

Estamos asistiendo a una reorientación importante de la manera en que los 
teóricos conceptualizan los mecanismos de reforzamiento. Los primeros investi- 
gadores seguían a Thorndike al suponer que el reforzamiento consistía en el for- 
talecimiento de una respuesta concreta cuando se presentaba un cierto tipo de 
estímulo (un reforzador) después de la aparición de la respuesta. Así pues, se 
hacía hincapié en los cambios que producía un tipo concreto de estímulo en una 
sola respuesta. Las conceptualizaciones más recientes del proceso de reforza- 
miento tienen una visión más amplia de la conducta de los animales. Se reconoce 
que el reforzamiento implica mucho más que la presentación de un estímulo. Los 
estímulos reforzantes deben consumirse o utilizarse de alguna forma. Las respues- 
tas consumatorías (acercamiento, masticación, deglución, por ejemplo, en el caso 
de la comida) desempeñan un papel esencial en las modernas concepciones de los 
procesos de reforzamiento. Además, las concepciones modernas se ocupan no sólo 
de los cambios en la respuesta reforzada que produce el condicionamiento ins- 
trumental, sino también de los cambios en otras actividades del sujeto. Así pues, 
se considera que el condicionamiento instrumental no fortalece, simplemente, una 
respuesta concreta, sino que crea una nueva distribución de actividades. Este cam- 
bio de perspectiva ha supuesto una transformación: de pensar en el reforza- 
miento como una forma de regulación fisiológica a pensar en el reforzamiento 
como una forma de regulación conductual. 


CUESTIONES FUNDAMENTALES DE LA TEORIA 
DEL REFORZAMIENTO 


Si tuviéramos que nombrar todos los estímulos que se han usado como refor- 
zadores, aparecería una lísta muy larga. Entre los estímulos más comunes se 
encuentran la comida, el agua, los compañeros sexuales y otros estímulos diver- 
sos, como el oxígeno, los aumentos de la temperatura atmosférica, una solución 
de sacarina e incluso una descarga eléctrica. La lista incluiría también actividades 
como las de ver un tren eléctrico en movimiento, jugar al pinball y correr en una 
rueda giratoria. Por último, podríamos incluir reforzadores que no siempre son 

: 
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fáciles de definir, como la aprobación de los demás, la autosatisfacción y el placer. 
¿Qué tienen en común todos esos estímulos que los convierte en reforzadores 
eficaces? Podríamos suponer que donde hay reforzamiento hay placer. Thorndike 
utilizó unos términos algo diferentes. En la ley del efecto describía lo que nos- 
otros llamamos ahora estímulos reforzadores como acontecimientos que producen 
«un estado satisfactorio». ¿Qué es un estado satisfactorio? o ¿qué es el placer? Es 
tentador definir el placer o el estado satisfactorio como el acontecimiento o estí- 
mulo por el que el sujeto actúa, o, en otras palabras, cualquier cosa que refuerza la 
conducta. Sin embargo, esto convierte la definición en circular. No podemos defi- 
nir un reforzador como algo que proporciona placer si definimos algo que pro- 
porciona placer como un reforzador. Lo que se necesita es una definición de pla- 
cer o de estado satisfactorio que mo se establezca en términos de los efectos del 
reforzamiento. 

La respuesta a «¿qué hace que los reforzadores refuercen?» nos proporciona 
una salida a la circularidad al restringir el ámbito de la cuestión. En vez de tratar 
de que la respuesta a la pregunta se aplique a todas las circunstancias, podemos 
intentar dar una respuesta que sirva sólo para un estímulo reforzador concreto 
que se use para fortalecer una respuesta concreta en una única situación. Por 
ejemplo, ¿qué hace que la comida sea un reforzador eficaz para la presión de la 
palanca en ratas colocadas en una caja de Skinmer? Una respuesta circular a esta 
cuestión sería que la comida refuerza la presión de la palanca porque en esta 
situación es un reforzador. Esta afirmación no es informativa. Meehl (1950) sugi- 
rió que el principio de transituacionalidad puede ser de ayuda en casos como 
éste. El principio de transituacionalidad supone que los reforzadores son eficaces 
para fortalecer la conducta en distintas situaciones. La comida, por ejemplo, se 
espera que refuerce no sólo la presión de la palanca en una caja de Skinner, sino 
también correr en un pasillo y nadar en un depósito de agua. Dada esta transitua- 
cionalidad, podemos utilizar los resultados de los efectos del reforzamiento en una 
situación para explicar los efectos en otra. Así pues, podemos decir que la comida 
fortalece la conducta en un experimento de presión de la palanca porque la 
comida se ha identificado como reforzador en un experimento de corredor. Esta 
explicación no es circular. Se identifican las propiedades reforzadoras de la 
comida en una situación (el experimento del corredor) que es diferente de la 
situación en la que estamos tratando de explicar el efecto del reforzamiento (el 
experimento de presión de la palanca). 

Aunque el principio de transituacionalidad ayuda a evitar la circularidad, no es 
enteramente satisfactorio. Supóngase que partimos del hecho de que la comida es 
un reforzador eficaz en un experimento de corredor para explicar por qué la 
comida fortalece la conducta en un experimento de presión de la palanca. Esa 
explicación no ofrecería una comprensión mayor de la conducta. La cuestión fun- 
damental de por qué los reforzadores refuerzan permanecería sin responder hasta 
que supiéramos por qué la comida es un reforzador eficaz en un experimento de 
corredor. Otro punto débil de este enfoque es que los reforzadores no son siempre 
eficaces a lo largo de toda una gama de situaciones. Como discutimos en el capí- 
tulo 5, existen limitaciones serias en el condicionamiento operante. Un reforzador 
eficaz para fortalecer uma respuesta puede no ser útil para reforzar otras 
conductas. 

Las teorías del reforzamiento que vamos a examinar en las páginas siguientes 
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representan un enfoque más analítico de la cuestión de qué es lo que hace al 
reforzador reforzar. Básicamente existen dos problemas centrales en el análisis. 
Un problema consiste en determinar las características esenciales de los reforza- 
dores. Si se conocieran, se podrían identificar rápidamente por la presencia O 
ausencia de esas características esenciales. El segundo problema es identificar los 
mecanismos implicados. Es decir, qué es lo que hace el reforzador y cómo lo hace. 

Las teorías del reforzamiento que vamos a discutir analizan las caracteristicas 
de los reforzadores y los mecanismos del reforzamiento de maneras diferentes. 
Vamos a comenzar con la discusión de las ideas tradicionales, y bastante familia- 
res, que conceptualizan el reforzamiento como la presentación de estímulos espe- 
ciales. Algunas teorías de este tipo conciben también el reforzamiento como la 
satisfacción de necesidades fisiológicas concretas. Vamos a discutir después el 
reforzamiento coceptualizado como regulación conductual que contribuye a la 
satisfacción de «metas» o «necesidades» conductuales. El enfoque tercero y último 
que vamos a considerar concibe el reforzamiento como un proceso de selección de 


la respuesta. 


EL REFORZAMIENTO COMO PRESENTACION DE UN ESTIMULO 


Tradicionalmente, el reforzamiento se ha concebido como la presentación de 
unos estímulos concretos contingentes a la ejecución de una respuesta instrumen- 
tal concreta. Se han sugerido varios estímulos especiales que pueden servir de 
reforzadores. Sin embargo, todas las teorías del reforzamiento que consideran al 
reforzador como un estímulo comparten el punto de vista de que el reforzamiento 
«fortalece» la respuesta instrumental. Las distintas concepciones difieren en la 
forma en que esto se logra. Thorndike propuso que el «fortalecimiento» de una 
respuesta instrumental es un resultado secundario de la formación de una asocta- 
ción entre los estímulos presentes en el momento de-la respuesta y el reforzador. 
Por el contrario, Skinner puso mucho más énfasis en la relación entre la res- 
puesta instrumental y el reforzador. Sugirió que el reforzamiento fortalece cual- 
quier conducta que ocurra justo antes de la presentación del reforzador. 


Homeostasis fisiológica y reducción del impulso 


En la mayor parte de las investigaciones sobre aprendizaje instrumental se 
usan como reforzadores estímulos biológicamente importantes como son la 
comida y el agua. A los sujetos se les suprime primero una sustancia, por ejemplo, 
la comida; el retorno de esta sustancia sirve de reforzador. Dado que dichos 
estímulos son necesarios para la supervivencia del animal, muchas teorías del refor- 
zamiento han centrado la atención en los factores fisiológicos del reforzamiento. 

Algunos teóricos del reforzamiento han descrito los procedimientos de priva- 
ción y reforzamiento como dos procesos contrarios que alteran el estado fisioló- 
gico del organismo. El concepto de homeostasts fisiológica es útil para describir 
los resultados de esos dos procesos. Con homeostasis fisiológica nos referimos al 
estado del organismo en que los sistemas fisiológicos están en perfecto equilibrio. 
Los procedimientos de privación habitualmente rompen el equilibrio. Por el con- 
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trario, el reforzamiento hace que el organismo vuelva a la homeostasis, al estado 
de equilibrio. Se considera que la motivación para dar la respuesta instrumental 
proviene de la pérdida de la homeostasis. Según este punto de vista, el reforza- 
miento funciona porque los organismos siempre buscan volvéase a la homeostasis. 

Uno de los primeros teóricos que extendió el uso del mecanismo de la 
homeostasis fisiológica fue Clark Hull (véase Amsel y Rashotte, 1984, para una 
revisión actualizada de la teoría de Hull). Hull pensaba que los procedimientos de 
privación utilizados en los experimentos que emplean comida y agua como refor- 
zadores crean un estado de impulso biológico. Se suponía que los reforzadores 
tenían la característica común de reducir este estado de impulso. De acuerdo con 
esta hipótesis, el mecanismo de reforzamiento implica un proceso homeostático. 
Cada vez que el sujeto obtiene el reforzador, se acerca un paso a la homeostasis. 
La tendencia innata del organismo a volvéase a la homeostasis es la motivación 
para la respuesta. Por tanto, según Hull, el grado de impulso determina (en 
parte) el grado de respuestas. 

Se supone que las necesidades fisiológicas, o impulsos, están relacionadas con 
elementos del ambiente que son necesarios para la supervivencia del individuo o 
de la especie. Por tanto, los estados de necesidad o de impulso pueden identifi- 
carse posiblemente mediante experimentos fisiológicos. Basándose en este punto 
de vista, se han utilizado con éxito como reforzadores la comida, el agua, el oxí- 
geno y los cambios de temperatura. 


Motivación primaria y motivación del incentivo 


La hipótesis de la reducción del impulso refleja el hecho de que el análisis del 
reforzamiento se presenta a menudo como parte de un campo más amplio: la 
motivación. El reforzamiento es un modo de forzar a la conducta a que cambie. 
¿Dónde, pues, se origina la fuerza? A veces, la fuerza parece que yace dentro del 
organismo como estado de impulso. La motivación inducida por un estado de 
impulso se llama motivación primaria. La motivación para la conducta puede 
provenir del propio reforzador. En ocasiones la simple presencia de comida, agua, 
o un compañero sexual, puede desencadenar la respuesta. Tal motivación, origi- 
nada por el propio reforzador, es llamada motivación del incentivo. Para grupos 
de animales con el mismo nivel de privación de comida, las raciones grandes o 
sabrosas pueden ser más eficaces para reforzar la conducta instrumental que 
raciones pequeñas o menos sabrosas. Una vez establecidos niveles equivalentes de 
privación de comida, esos resultados no pueden explicarse en términos de dife- 
rencias en el nivel de impulso, e ilustran la importancia de la motivación del 
Incentivo. 

Tenemos, por tanto, dos posibles fuentes de motivación: (1) el estado de 
impulso y (2) las propiedades incentivas del reforzador. En la literatura psicoló- 
gica se ha discutido largamente el papel de cada uma de estas fuentes (véase 
Bolles, 1975). En la actualidad, parece que el reforzamiento no es ni simplemente 
la reducción del impulso ni simplemente la motivación del incentivo. Los dos 
aspectos desempeñan un papel. Miller y Kessen (1952), por ejemplo, compararon 
los efectos de un reforzamiento con comida que se introducía directamente en el 
estómago a través de una fístula y una con comida ingerida de forma normal. 
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Hallaron que la alimentación con una fístula podía actuar eficazmente como 
reforzador. Parece que la reducción del impulso mediante la alimentación con una 
fístula era suficiente. Sin embargo, el efecto no era tan intenso como el que se 
producía con la ingestión normal. La ingestión normal puede ser más eficaz para 
incrementar la respuesta instrumental porque supone tanto el reforzamiento por 
reducción del impulso como la motivación del incentivo. 

Actualmente, conviene pensar que todas las fuentes de motivación contribu- 
yen a que el reforzamierito tenga efecto. La investigación moderna en fisiología y 
bioquímica sobre estimulación cerebral ha contribuido de forma importante a 
nuestro entendimiento de los procesos motivacionales que intervienen en el 
reforzamiento. 


El reforzamiento sensorial 


La distinción entre motivación primaria y motivación del incentivo ilustra que 
los mecanismos de reducción del impulso no son suficientes para explicar todos 
los efectos del reforzamiento. Los estímulos externos desempeñan también un 
papel importante en la motivación de la conducta instrumental. Otras pruebas 
sugieren que la reducción del impulso puede incluso no ser necesaria para el 
reforzamiento. Sheffield, Wulff£ y Backer (1951), por ejemplo, demostraron que 
una rata macho correrá a lo largo de un corredor para tener acceso a una hembra 
aun cuando no se le permita copular con ella. En este caso, la conducta instrumen- 
tal se realizó para obtener un estímulo que no provocaba reducción del impulso, 
De hecho, el nivel de impulso o excitación del macho se incrementó por el 
encuentro con la hembra sin que existiera copúlación. Así pues, como efecto del 
reforzamiento se obtuvo un aumento en vez de un descenso del impulso. 

La poca importancia de la reducción del impulso en el reforzamiento se ¡hustra 
también con numerosos ejemplos de los efectos reforzadores de los estímulos que 
no son biológica o fisiológicamente significativos. Un importante teórico del 
reforzamiento comentó que «prácticamente cualquier cosa puede actuar como 
reforzador en circunstancias adecuadas» (Berlyne, 1969, pág. 182). Actividades 
como ver un tren eléctrico en movimiento pueden utilizarse para reforzar la 
conducta de los monos. Encender una luz, la oportunidad de una exploración y 
beber una solución de sacarina que no tiene ningún valor nutritivo, y por tanto no 
reduce una necesidad fisiológica, pueden ser también premios eficaces. Es una 
experiencia humana común que la motivación de una conducta se debe a las pro- 
piedades sensoriales de los estímulos. Los buenos trabajos de arte y de música, por 
ejemplo, suministran un reforzamiento sensorial primario. 

Para explicar la eficacia de los reforzadores sensoriales se podría proponer la 
hipótesis de la existencia de estados de impulso correspondientes. Por ejemplo, se 
podría proponer la hipótesis de la existencia de un impulso de curiosidad para 
explicar el efecto reforzador de ver un tren eléctrico en movimiento. Sin 
embargo, este enfoque no es muy productivo. La única prueba de la existencia de 
un impulso de curiosidad es que los trenes en movimiento y similares son refor- 
zadores eficaces. Esto introduce el mismo problema de circularidad que discutía- 
mos antes. Habríamos dicho que un tren en movimiento refuerza la conducta 
porque reduce el impulso de curiosidad, y que sabemos que existe curiosidad por- 
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que la visión de un tren en movimiento refuerza la conducta. La teoría de la 
reducción del impulso nos obliga a añadir un elemento a nuestra lista de impulsos 
cada vez que hallamos un reforzador que no satisface un impulso biológico que ha 
sido identificado por otros medios. Sin embargo, si hacemos esto, no habrá forma 
“de identificar independientemente los reforzadores. Por tanto, la hipótesis de la 
reducción del impulso mo ha logrado especificar con éxito una característica 
común de los reforzadores independiente de sus efectos de reforzamiento. 


El reforzamiento por estimulación cerebral y la motivación 


Dos psicólogos también fisiólogos, James Olds y Peter Milner, implantaron 
electrodos en el área septal del cerebro de las ratas. A continuación, las ratas eran 
observadas en un compartimento grande donde se les aplicaba pulsos eléctricos 
suaves y breves en el cerebro a través de los electrodos. Las ratas tendían a 
moverse hacía el área de la cámara donde habían recibido la última estimulación 
cerebral. Olds y Milner conectaron después una palanca al estimulador eléctrico y 
descubrieron que las ratas, con objeto de recibir la estimulación cerebral, presio- 
naban la palanca durante muchas horas sabiendo sus tasas de respuesta extrema- 
damente altas. El fenómeno se llamó autoestimulación intracraneal (Olds y Mil. 
ner, 1954), El estudio de Olds y Milner despertó el interés en varias áreas. Las 
consecuencias de la investigación fueron tremendas. La perspectiva de tener dis- 
ponible un reforzador tan poderoso plantea problemas morales y prácticos sobre 
el control de la conducta (véase apartado 7.1). Los teóricos del reforzamiento, sin 
embargo, se interesaron por aspectos menos atractivos del fenómeno. La investi- 
gación en autoestimulación hizo abrigar esperanzas de que se pudiera encontrar 
un mecanismo común a todos los reforzadores mediante un análisis fisiológico. 

Los hallazgos de Olds y Milner estimularon varios días de investigación. Se 
realizaron muchos experimentos para delimitar las distintas áreas del cerebro en 
las que se producía un efecto de reforzamiento cuando eran estimuladas. Además, 
se realizaron mumerosos análisis neuroquímicos de las distintas vías neurológicas. 
Otro conjunto de experimentos ha explorado la semejanza de la autoestimulación 
con otras clases de reforzadores. Una característica destacada de la autoestimula- 
ción es que es persistente, y que las tasas de respuesta son altas comparadas con 
otros tipos de respuestas instrumentales. En otro sentido, la autoestimulación 
parece ser similar a los reforzadores tradicionales cuando se comparan los dos en 
situaciones cuidadosamente controladas (para una revisión, véase Mogenson y 
Cioe, 1977). Por ello, las explicaciones de los efectos de la autoestimulación han 
sido las mismas que las de los reforzadores tradicionales. En general, se supone 
que una explicación de base psicológica puede servir para ambas. 

La primera explicación del reforzamiento por estimulación cerebral recurría a 
la reducción del impulso. Se propuso la hipótesis de que la estimulación cerebral 
activaba los circuitos neurológicos que intervenían en la reducción de los impulsos 
mediante una conducta consumatoria. Sin embargo, esta explicación resultó ser 
simplista. Se descubrió que la misma estimulación eléctrica del cerebro que 
refuerza la presión de la palanca puede también provocar respuestas tales como 
comer, beber y conducta sexual cuando está disponible el estímulo apropiado 
(comida, agua o pareja sexual) (por ejemplo, Caggiula y Hoebel, 1966; Herberg, 
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1963; Hoebel y Teitelbaum, 1962; Margules y Olds, 1962; Mogenson y Stevenson, 
1966). Así pues, la estimulación cerebral parece que induce más que reduce los 
impulsos. Deutsch (1960) llegó a la conclusión de que el reforzamiento, en gene- 
ral, requiere tanto la inducción del impulso como la posterior reducción del 
impulso. Glickman y Schiff (1967) ofrecieron una interpretación de los experi- 
mentos ligeramente diferente. Sugirieron que el origen del efecto del reforza- 
miento son las respuestas específicas de la especie, como comer y beber, que 
ayudan al organismo a adaptarse a su ambiente. La estimulación cerebral! y los 
procedimientos instrumentales de privación-reforzamiento tienen los mismos 
efectos sobre la conducta porque son simplemente dos formas de provocar esas 
respuestas adaptativas. 

Otras investigaciones sugieren que la autoestimulación implica una motiva- 
ción del incentivo. Pfaffman (1960) propuso que la autoestimulación es el resul- 
tado de activar las vías que generalmente trasmiten sensaciones tales como el 
sabor de la comida. Según este punto de vista, la estimulación cerebral refuerza la 
conducta por la misma razón que la sacarina es un reforzador eficaz, no por una 
reducción del impulso, sino a través de las sensaciones implicadas en las respues- 
tas consumarorias. Campbell (1971) encontró pruebas que apoyaban esta hipóte- 





APARTADO 7.1. «Cerebros que buscan el placer: cosquillas artificiales, alegrías 
naturales del pensamiento» 


En un artículo con este título, el psicólogo H. J. Campbell (1971) discutía el significado 
de la investigación sobre autoestimulación a la luz de la teoría evolutiva y del significado 
de ser «humano». La investigación de Campbell se centra en la estimulación natural del 
sistema límbico del cerebro. Propone que en los animales inferiores la estimulación senso- 
rial conduce a una estimulación del sistema límbico. Cuando a los animales se les da la 
oportunidad de estimularse sensorialmente con un aparato eléctrico de hacer cosquillas, lo 
harán de una forma muy similar a la que emplean para estimular estructuras más centrales 
del cerebro. La diferencia fundamental es que la estimulación sensorial sacia o habitúa, 
mientras que la estimmlación del sistema límbico no. Sin embargo, como advierte Camp- 
beil, cuando un sistema sensorial se sacia, el animal cambia a otro. No se retira para 
simplemente no hacer nada. ; 

Campbell, por tanto, sugiere que el principio de conducta que subyace es mantener el 
sistema límbico estimulado, La filogenia determina la forma en que esto puede hacerse. 
Podemos suponer que las plantas, a diferencia de los animales, no rienen centros de placer. 
Conforme nos movemos por la escala filogenética las interconexiones entre el sistema 
límbico y otros sistemas neurológicos se van complicando de forma creciente. En los ani- 
males inferiores el sistema límbico posee un receptor primario en lugar de órganos senso- 
riales. En las personas, sin embargo, las conexiones neurológicas en las que interviene el 
sistema límbico son más extensas e incluyen el córrex del cerebro. Por esta razón, las 
actividades corticales complejas, tales como el pensamiento o la resolución de problemas, 
pueden estimular las estructuras límbicas. Así pues, estas actividades ayudan a mantener 
activado nuestro sistema límbico. Por supuesto, en los organismos superiores el sistema 
límbico está también ligado a los órganos de los sentidos. La conducra que a veces llama- 
mos subhumana o animal (el vandalismo por puro placer, comer en exceso, etcétera) 
también se presenta en Jos humanos. Campbell propone que nuestras instituciones sociales 
existen para mantener bajo control esas formas de búsqueda de placer y promover formas 
intelectuales superiores de estimulación límbica. Si el circuito eléctrico que nos permite 
encontrar placer en las actividades intelectuales es el resultado de la evolución dejando 
volar la fantasia, nos podemos imaginar que la evolución puede todavía producir orra 
criatura capaz de placeres intelectuales. La propuesta de Campbell nos ofrece la posibilidad 
de que dentro de un millón de años el pulpo pueda comprender teoremas matemáticos. 
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sis. Mostró que el reforzamiento por estimulación cerebral puede ser producido 
por una estimulación eléctrica de las vías neurológicas periféricas, que se han 
identificado en general como transmisoras de las sensaciones provenientes de los 
reforzadores naturales. Campbell propuso que la base fisiológica del premio yace 
en la activación de las vías centrales del premio a través de cualquiera de los 
posibles receptores. Por lo general, pensamos que los estímulos exteroceptivos, 
como el sabor y el olor, despiertan los receptores sensoriales. Sin embargo, son 
posibles otras clases de receptores. En el cerebro humano, las vías podrían acti- 
varse posiblemente por medio de procesos cognitivos. Esto aclararía por qué 
algunas personas obtienen placer al realizar un puzzle, estudiar matemáticas, 
etcétera, y por qué esas actividades pueden, a veces, hacer de reforzadores. 
Como ocurre con los reforzadores tradicionales, la investigación sobre estimu- 
lación cerebral sostiene la idea de que el reforzamiento es el resultado tanto de un 
estado de impulso como de la motivación del incentivo. Se han presentado prue- 
bas que apoyan este punto de vista, provenientes del hecho de que la tasa de 
autoestimulación puede aumentarse o disminuirse alterando el estado de impulso 
o los estímulos incentivadores. Por ejemplo, una rata se autoestimulará más 
rápido si además se la ha privado de comida (Olds, 1958). Si el sitio de la estíimu- 
lación también induce a beber, la autoestimulación aumentará en caso de que haya 
agua disponible (Mendelson, 1967; Mogenson y Kaplinsky, 1970; Mogenson y 
Morgan, 1967). Si se le da más sabor al agua añadiéndole sacarina, la tasa de 
respuesta aumentará aún más (Phillips y Mogenson, 1968). Resultados como 
éstos han llevado a los teóricos a concluir que el reforzamiento se produce cuando 
un estímulo externo (por ejemplo, agua) se presenta en conjunción con un estado 
general de impulso (por ejemplo, sed). Esto es, por supuesto, lo que ocurre en la 
situación instrumental típica. Ambos elementos también parecen presentarse con 
la estimulación cerebral aunque esté inducida artificialmente. Varios teóricos han 
sugerido mecanismos para describir esos efectos duales de forma más precisa (por 
ejemplo, Bindra, 1969; Mogenson y Huang, 1973). Vamos a describir brevemente 
el modelo de Milner porque se centra directamente en la estimulación cerebral y 
en los reforzadores convencionales. 
Miner (1970) sugirió que cuando un organismo sufre privación sobreviene 
una activación comductual general. La activación conductual se caracteriza por la 
conducta exploratoria y el aumento de otras respuestas motoras. La conducta del 
organismo consiste en cambiar de una respuesta a otra. Si al dar una respuesta 
concreta el organismo encuentra un estimulo apropiado, se activa un mecanismo 
que sostiene la respuesta. El animal ya no cambia más de una respuesta a Otra. 
Más bien, permanece encerrado en la respuesta que lo mantiene en contacto con 
el estímulo hasta que se reduce el estado de impulso. En el caso de la estimulación 


cerebral, Milner ha propuesto que algunas de las vías neurológicas sufren un 


cortocircuito. Los mecanismos de cambio de la respuesta pudieran ser inhibidos 
por mucho tiempo, dando paso a la conducta persistente de autoestimulación. El 
modelo de Milner se refuerza con los trabajos paralelos sobre las vías de la cateco- 
lamina en el cerebro. Esas vías parece que intervienen en la estimulación cerebral 
y pueden realizar los procesos que el modelo de Milner requiere (Milner, 1976). 
Todavía hay que esperar a que futuras investigaciones nos suministren una com- 
prensión completa del funcionamiento de los mecanismos neurológicos del refor- 
zamiento. 


a 
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Las teorías estimulares del reforzamiento que consideramos en la sección 
anterior o bien estaban relacionadas directamente con mecanismos fisiológicos del 
reforzamiento, o bien se formularon en respuesta a las teorías que concebían el 
reforzamiento como un mecanismo para la regulación de los sistemas fisiológicos 
internos. Estas teorías comparten la suposición de que la conducta reforzada se 


. adjestra, o se inserta, dentro del repertorio conductual del organismo. La suposi- 


ción subyacente en el conjunto de teorías que vamos a considerar a continuación 
es muy diferente. Esas teorías no tienen que ver con los sustratos fistológicos del 
reforzamiento. Antes bien, el reforzamiento se describe en términos de la forma 
en que el organismo debe ajustar su conducta para cumplir las demandas de una 
situación particular. No se considera que los efectos del reforzamiento impliquen 
un estampamiento de una respuesta concreta, sino una reorganización de la con- 
ducta. Las distintas teorías describen formas diferentes posibles en que se produce 
esta reorganización. 

La homeostasis, como hemos dicho, es un estado fisiológico de equilibrio del 
organismo. La homeostasis llega a ser importante para el reforzamiento cuando 
se producen desviaciones del estado de equilibrio y el organismo intenta rectificar 
la situación. Las teorías de la regulación conductual que vamos a considerar en 
esta sección sostienen que existe un mecanismo homeostático similar respecto a 
la conducta. Es decir, podemos considerar que el organismo posee un equilibrio 
particular de respuestas, y lo tiene que mantener, El organismo tiene cosas con- 
cretas que hacer: debe comer, respirar, beber, mantenerse caliente, realizar ejerci- 
cio, entretenerse, etcétera. Todas esas actividades tienen que ocurrir en propor- 
ciones determinadas. Se supone que si se altera el equilibrio normal u óptimo de 
las actividades, la conducta cambia hasta que la desviación de la homeostasis con- 
ductual es corregida. El equilibrio conductual puede, de hecho, servir para mante- 
ner la homeostasis fisiológica. Comer, beber y hacer ejercicio contribuyen al man- 
tenimiento de la homeostasis fisiológica. Sin embargo, las teorías de la regulación 
conductual del reforzamiento se formulan en términos de procesos conductuales 
más que fisiológicos. Otra innovación importante de las teorías de la regulación 
conductual es su concepción del reforzamiento como aparición de nuevas oportu- 
nidades en las respuestas concretas a las que dedicarse, más que como presenta- 
ción de tipos concretos de estímuios. La atención se centra en las relaciones entre 
la respuesta instrumental y las respuestas que se han hecho posibles gracias a la 
presentación del «reforzador». 


Precedentes de las teorías de la regulación conductual 


Las teorías de la regulación conductual surgieron a partir de las ideas sobre el 
reforzamiento formuladas por David Premack a mediados de los años sesenta. 
Premack desarrolló la idea de que las oportunidades para dedicarse a un tipo 
concreto de respuesta pueden servir como reforzadores. La posibilidad de que 
ciertas respuestas puedan hacer de reforzadores fue considerada por primera vez 
por Sheffield y sus colaboradores, que formularon la teoría de la respuesta con- 
sumatoria. La teoría de la respuesta consumatoría se propuso en un esfuerzo por 
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explicar la razón por la que estímulos incentivadores concretos, como la comida, 
son reforzadores eficaces. La mayoría de los reforzadores tienen que «tomarse», 
que consumirse, para ser eficaces. En este proceso hay implicadas muchas sensa- 
ciones que pueden ser importantes. Esto sugiere que las sensaciones producidas 
por las respuestas necesarias para consumir el reforzador pueden ser reforzantes. 
La teoría de la respuesta consumatoria afirma que las conductas consumatorias 
(comer, beber y demás) son en sí mismas la característica esencial de los reforza- 
dores. La respuesta consumatoria podría ir seguida de hechos como la reducción 
del impulso, pero éstos no se considerarían importantes en el reforzamiento. Las 
investigaciones sobre la teoría de la respuesta cosumatoria se centraron en las 
demostraciones de que las respuestas consumatorias podían reforzar la conducta 
instrumental en ausencia de una reducción del impulso. Se realizaron famosos 
experimentos que mostraban que la sacarina, un edulcorante artificial, es un 
reforzador eficaz para las ratas (por ejemplo Sheffield, Roby y Campbell, 1954). 
Una solución suave de sacarina tiene un sabor agradable y estimula la conducta 
consumatoria, pero no es nutritiva y, por tanto, no reduce un estado de impulso. 


La teoría del reforzamiento de Premack 


La teoría de la respuesta comsumatoria representa un paso adelante a partir 
de las teorías del reforzamiento estimular en el sentido de que se considera el 
reforzamiento como la oportunidad de dedicarse a un tipo-concreto de respuesta. 
Sin embargo, todas esas teorías comparten la suposición de que las respuestas que 
acompañan a los estímulos reforzantes son, en algún aspecto, fundamentalmente 
diferentes de las respuestas que hacen de conducta instrumental. Se supone que 
las respuestas consumatorias (masticar y tragar, por ejemplo) son esencialmente 
diferentes de otras respuestas instrumentales potenciales como correr, saltar o 
manipular algo. Premack se opuso a esta distinción y sugirió que las respuestas 
instrumentales y las respuestas que acompañan a los estímulos reforzantes difie- 
ren sólo en su probabilidad de aparición. Señaló que las respuestas relacionadas 
con los reforzadores utilizados normalmente son actividades que el sujeto tiene 
una alta probabilidad de realizar. Por ejemplo, es muy probable que los animales 
de un experimento de reforzamiento con comida den respuestas de comer. Los 


procedimientos de privación sirven para asegurar que comer será la conducta más 


probable en la situación. Por el contrario, las respuestas instrumentales son habi- 
tualmente actividades de baja probabilidad. Por ejemplo, una rata novata desde el 
punto de vista experimental es bastante improbable que presione una palanca. 
Premack (1965) propuso que esta diferencia en las probabilidades de respuesta es 
esencial para el reforzamiento. Formalmente, su principio del reforzamiento 
puede enunciarse del modo siguiente: Dadas dos respuestas en un procedimiento 
de condicionamiento operante, la respuesta más probable reforzará a la conducta 
menos probable; la respuesta menos probable no reforzará a la conducta más 
probable. 

Comer reforzará el presionar la barra porque habitualmente comer es más 
probable que presionar una barra. En circunstancias normales, presionar la barra 
no puede reforzar el comer. Sin embargo, la teoría de Premack sugiere que si, por 
alguna razón, presionar la barra se hiciera más probable que comer, reforzaría 
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esto último. Así pues, la teoría de Premack niega que exista una distinción fun- 
damental entre los reforzadores y las respuestas instrumentales. La característica 
concreta que hace a un reforzador actuar como tal no es algo intrínseco a la 
respuesta reforzadora. Antes bien, la respuesta reforzante es simplemente una 
respuesta que tiene más probabilidades de ocurrir que la respuesta instrumental. 
Por consiguiente, es posible utilizar una amplia variedad de respuestas como 
reforzadores. 


Demostración expersmental. Premack y sus colaboradores llevaron a cabo 
muchos experimentos para comprobar su teoría (véase Premack, 1965, 1971a). 
Uno de los primeros estudios fue una prueba muy simple con niños pequeños. 
Premack ofreció a los niños dos respuestas alternativas (comer caramelos y jugar 
con una máquina de pinball) y midió qué respuesta era más probable en cada 
niño. Unos niños prefirieron comer caramelos antes que jugar a las maquinitas; 
otros prefirieron los pinball. En una segunda fase del experimento (véase figura 
7.1), los niños fueron sometidos a pruebas con uno de los dos procedimientos' 
utilizados. En un procedimiento se determinó el comer como la respuesta refor- 
zante, y jugar al pinball como la respuesta instrumental, Esto es, el niño tenía que 
Jugar al pinball para tener oportunidad de comer caramelos. La cuestión era saber 
si todos los niños aumentarían su conducta de jugar al pinball. Cumpliendo la 
teoría de Premack, sólo aquellos niños que prefirieron comer antes que jugar al 
pinball acusaron un efecto de reforzamiento en esas circunstancias. En el segundo 
procedimiento, los papeles de las dos respuestas se invirtieron. Comer era la 
respuesta instrumental y jugar al pinball la respuesta reforzante. Los niños tenían 
que comer caramelos para tener la oportunidad de jugar ál pinball. En esta situa- 
ción sólo los niños que habían preferido jugar al pinball antes que comer acusaron 
un efecto de reforzamiento. 


Fase 1 Figura 7.1.—Dragrama del estu- 
Pueden comer y jugar al pinball cuanto quieran dio de Premack (1965). 
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En otro experimento, Premack (1962) alteró las probabilidades de las res- 
puestas cambiando las condiciones de privación. Unas ratas pasaron por pruebas 
en las que se utilizaban las respuestas de beber y correr en una rueda giratoria. El 
experimento se muestra en el diagrama de la figura 7.2. En un estudio, las ratas 
fueron privadas de agua, pero no privadas de la oportunidad de correr en la rueda. 
En esas circunstancias, beber era más probable que correr, y la oportunidad de 
beber podía utilizarse más eficazmente para reforzar el correr. En el segundo 
estudio, las ratas no fueron privadas de agua. En esas circunstancias era más 
probable correr en la rueda que beber. Ahora correr en la rueda podía utilizarse 
más eficazmente para reforzar el beber. Sin embargo, beber ya no podía utilizarse 
para reforzar el correr. Así pues, correr y beber podían usarse indistintamente 
corno respuestas reforzadoras e instrumentales, dependiendo del estado de priva- 
ción de agua del animal. 


Medidas de la probabilidad de la respuesta. Los dos experimentos descritos 
arriba constan de dos partes. En la primera parte se midió la conducta en una 
situación en la que el sujeto tenía una oportunidad ilimitada de dar cualquiera de 
las respuestas que se iban a utilizar después como respuestas instrumentales y 
reforzadoras. Se supone que esta situación revela el equilibrio homeostático con- 
ductual del organismo cuando no se ponen límites a las respuestas. Llamamos a esto 
fase de la línea de base. En la segunda parte de los experimentos, en la fase del 
condicionamiento instrumental, se ofrecía la oportunidad de dar la respuesta 
reforzadora de alta probabilidad sólo cuando el sujeto daba la respuesta instru- 


Experimento 1 
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Figura 7.2.—Cuando a una rata se le priva de agua (Experimento 1), bebe más que corre. Por tanto, 
beber refuerza el correr. Cuando no se le priva de agua, corre más que bebe. Esta vez correr refuerza el 


beber. (Según Premack, 1962.) 
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mental de baja probabilidad. Como ya se vio, lo que ocurría en la segunda fase 
dependía de las probabilidades relativas de las dos respuestas durante la fase de la 
línea de base. Por tanto, antes de poder hacer predicciones precisas sobre la forma 
en que una respuesta va (o no va) a reforzar a otra, debemos tener algún modo de 
medir y comparar las probabilidades de las dos respuestas en la línea de base. 

Una posible medida de la probabilidad de la respuesta es la frecuencia con que 
ocurre cada respuesta en una cantidad de tiempo. Esa medida es buerra siempre y 
cuando estemos comparando respuestas que necesiten una cantidad de tiempo 
similar, tal como presionar dos palancas alternativas, pero idénticas por otra 
parte. ¿Qué haríamos, sin embargo, si quisiéramos comparar la probabilidad de 
dos respuestas muy diferentes, como hacer un crucigrama y comer? Comparar 
aquí las frecuencias de la respuesta sería muy incómodo y difícil. Deberíamos 
definir qué es lo que constituye un caso, o unidad, de la conducta de resolución de 
crucigramas y qué constituye un caso, o unidad, de comer. ¿Completar una palabra 
del crucigrama es una unidad de la conducta de resolución de crucigramas o lo es 
el completar todos los elementos de una determinada dirección (las líneas hori- 
zontales y verticales)? Una unidad del comer, ¿significa dar un bocado, acabarse 
un plato, tomar la comida entera? Tenemos que decidir, pues, qué unidad posible 
de la resolución de pasatiempos se debería considerar equivalente a qué unidad 
del comer. ¿Es cada respuesta al crucigrama comparable a cada bocado de comida? 

Como sugiere la discusión anterior, es difícil formular unidades comparables 
de conducta para las diversas actividades. Sin embargo, una dimensión común a 
todas las respuestas es el tiempo. Premack sugirió que la probabilidad de la res- 
puesta podía medirse en función de la cantidad de tiempo que el sujeto tarda en 
dar la respuesta en un período determinado. Podemos expresar esta idea con la 
ecuación siguiente: 


probabilidad de la respuesta =_US'TPO dedicado a la respuesta 


tiempo total 


Según esta definición, las respuestas que consumen una proporción mayor del 
tiempo disponible se consideran más probables que las respuestas a las que los 
sujetos dedican menos tiempo. Si en una hora dedicamos 45 minutos a la comida 
y 15 a la resolución de un crucigrama, diríamos que en esa hora comer fue más 
probable que resolvéase un crucigrama. Por tanto, el comer reforzaría a la resolu- 
ción del crucigrama. 

Aunque la medida de la probabilidad de una respuesta de Premack propor- 
ciona un medio de comparar las distintas respuestas, en algunos casos va en con- 
tra de la intuición. Considérese, por ejemplo, una comparación entre la conducta 
sexual y el estudio. Un estudiante puede dedicar mucho más tiempo a leer que a la 
actividad sexual. Sin embargo, la mayoría de los estudiantes encontrarían la con- 
ducta sexual mucho más agradable y reforzadora. Esta paradoja puede resolverse 
si tenemos en cuenta la duración de las observaciones de la línea de base. Dada 
una elección totalmente libre entre sexo y lectura en un período de dos horas, lo 
más probable es que predomine el sexo. Sin embargo, en un período superior a 
dos horas leer puede ser la respuesta más probable. El período de observación de 
la línea de base es también esencial para valorar la probabilidad de que las res- 
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puestas ocurran sólo periódicamente. Por ejemplo, aunque en un período de 24 
horas pasemos comiendo una gran parte del tiempo, el comer no se distribuye 
uniformemente a lo largo del día. Antes bien, es altamente probable sólo a ciertas 
horas. Además, cuanto más tiempo dediquemos a una actividad, tal como la de 
comer, menos probable será esta respuesta durante un rato. Después de una hora 
de dedicación a la gastronomía, comer se convierte en conducta muy ¿mprobable. 

Dado que las probabilidades de respuesta varían con el tiempo, Premack 
sugiere más adelante que la medida de respuesta más apropiada es la probabilidad 
momentánea. La utilización de esta medida se ilustra en un experimento hipoté- 
tico en el que se utilizan dos respuestas cuya frecuencia cambia de diferentes 
maneras durante una sesión. El experimento se resume en la figura 7.3. La pro- 
babilidad de la respuesta A desciende a medida que la sesión avanza. En cambio, 
la probabilidad de fa respuesta B aumenta. A lo largo de toda la sesión, el sujeto 
dedica más tiempo a la respuesta Á que a la respuesta B. Sin embargo, la res- 
puesta Á puede reforzar a la respuesta B sólo durante la primera parte de la 
sesión, ya que la probabilidad momentánea de la respuesta A es más alta sólo 
durante este tiempo. Durante la segunda parte de la sesión, la respuesta B tiene 
una probabilidad momentánea superior y, por tanto, reforzará de forma eficaz a 
la respuesta A. 


La probabilidad de la respuesta como medida del valor de la respuesta. 
Nuestra discusión lleva implícito que cuanto más probables sean las respuestas, 
más valoradas y preferidas serán. De hecho, Premack sugiere que el valor está en 
la base de toda conducta. Los organismos sopesan todas las alternativas de res- 
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Figura 7.3.—Diagrama de las hipotéticas probabilidades de respuesta de dos respuestas con diferentes 

probabilidades en el tiempo. Al comienzo de la sesión (riempo=0), la respuesta Á tiene una probabi- 

lidad momentánea mayor que la respuesta B, Así pues, la respuesta A puede reforzar a la respuesta B. 

En el tiempo T, la respuesta B se hace más probable que la respuesta A. A partir de este momento, la 
respuesta B puede reforzar la respuesta A. 
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puesta en términos de su valor. En cualquier momento considerado, se dedica más 
tiempo a las respuestas de más valor. Si esto fuera cierto, la probabilidad de la 
respuesta debería coincidir con otras medidas de valor. En el capítulo 6 discutimos 
los programas concurrentes como una forma de medir el valor del reforzamiento. 
La ley de la igualación afirma que la tasa relativa de respuestas es Igual al valor 
relativo del reforzamiento. Si medimos el tiempo dedicado a responder, en vez de 
la tasa de respuestas tenemos 


T1 v1 


tiempo total valor total 
y 
12 V2 


tiempototal valor total 


para cada una de las dos alternativas. Así pues, la medida de la probabilidad de la 
respuesta de Premack puede usarse como medida del valor si consideramos las 
respuestas en el programa 1 como una primera conducta y las respuestas en el 
programa 2 como una segunda conducta. 

La idea de que el valor está en la base del tiempo que se dedica a las distintas 
respuestas es central para la teoría homeostática del reforzamiento. Podemos 
considerar que los cambios de conducta que atribuimos normalmente a procedi- 
mientos motivacionales se reflejan en cambios en el valor de la respuesta (Pre- 
mack 197la). El hambre, la sed y el aumento del apetito sexual reflejan un 
aumento en el valor de comer, beber y de la conducta sexual. Cualquier procedi- 
miento (tal como la privación) que aumenta el valor de una respuesta respecto a 
la conducta instrumental capacitará a esta respuesta para hacer de reforzador. Los 
verdaderos motivos de que el valor haya cambiado no son necesariamente impor- 
tantes para predecir los efectos del reforzamiento. 


Probabilidad momentánea y restricciones a la respuesta reforzadora. En la 
mayoría de los procedimientos de condicionamiento instrumental, la probabilidad 
momentánea de la respuesta reforzadora se mantiene a un nivel alto. Esto se 
logra generalmente restringiendo la oportunidad de realizar la respuesta reforza- 
dora. Una rata que presiona la palanca para obtener comida, por ejemplo, entra 
habitualmente en la situación experimental sin haber comido mucho, y no recibe 
una comida completa por cada respuesta de presión de la palanca. Estas limira- 
ciones a la respuesta reforzadora son muy importantes. Si diéramos a la rata una 
comida completa cada vez que presiona la palanca, lo más probable es que no 
aumentáramos mucho su tasa de presión. Las restricciones a la oportunidad de 
dar la respuesta reforzadora sirven para incrementar su probabilidad momentá- 
nea. En general, los procedimientos de condicionamiento instrumental se caracte- 
rizan por requerir que el sujeto dé más respuestas instrumentales por menos 
respuestas reforzadoras de las que daría en una situación sin restricciones. 

Las restricciones a la respuesta reforzadora deberían tenerse en cuenta al 
medir las probabilidades de respuesta de la linea de base. Es decir, durante la 
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sesión de la línea de base, la cantidad de tiempo dedicado a las distintas respuestas 
debería medirse en las mismas circunstancias limitadas en que se presentarán 
durante la sesión de condicionamiento instrumental. Por ejemplo, la probabilidad 
de comer debería medirse en términos de la cantidad de tiempo dedicado a comer 
cuando la comida se entrega en bolitas pequeñas, como sucede durante el condi- 
cionamiento instrumental. 

El hecho de que se limite la respuesta reforzadora constituye un aspecto muy 
importante de la situación de condicionamiento instrumental. Según Premack 
(1965) es una de las condiciones necesarias para el reforzamiento. Las limitacio- 
nes impuestas al reforzador dan como resultado una pérdida de homeostasis con- 
ductual. Esto es, al suministrar el reforzador sólo cuando la respuesta instrumen- 
tal se ha producido, se impone un desequilibrio en el flujo normal de la conducta. 
El sujeto no puede distribuir el tiempo entre las diversas respuestas del modo en 
que solía hacerlo. Podemos pensar, pues, que la limitación impuesta a la respuesta 
a través del procedimiento instrumental da lugar a cierto tipo de tensión conduc- 
tual. Tal grado de tensión conductual, generado por la privación conductual, 
puede ser necesario incluso para obtener el efecto de reforzamiento más pequeño. 


Punto de deleste conductual y regulación conductual 


El principio del reforzamiento de Premack se formuló en términos de las 
probabilidades relativas de las respuestas instrumentales y reforzadoras. Como 
hemos visto, sin embargo, Premack era consciente de que la eficacia como refor- 
zador de una respuesta depende de que estén limitadas las oportunidades de eje- 
cutar esa respuesta. Esta idea ha sido desarrollada más tarde en las teorías de la 
regulación conductual del reforzamiento (véase Allison, 1983; Hanson y Timber- 
lake, 1983; Timberlake, 1980, 1984; Timberlake y Allison, 1974). Las teorías de la 
regulación conductual no se centran en las probabilidades relativas de las respues- 
tas reforzadoras e instrumentales, sino en hasta qué punto una contingencia ins- 
trumental respuesta-reforzador altera la estabilidad conductual y fuerza al sujeto 
más allá de su punto de deleite conductual. 

Cada situación ofrece varias oportunidades de respuesta. Én una situación 
experimental, por ejemplo, un animal puede correr dentro de una rueda, beber, 
comer, rascarse, oler agujeros o manipular una palanca. La teoría de la regulación 
conductual supone que si los animales son libres para distribuir sus respuestas 
entre las alternativas disponibles, lo harán de la manera que les resulte más 
cómoda, o en un sentido «óptima» para ellos. Podemos considerar que esta distri- 
bución de las respuestas define el «punto de deleite» conductual. La distribución 
concreta de actividades que constituyen un punto de deleite variará de una situa- 
ción a otra. Por ejemplo, si cuesta hacer que la rueda de correr dé vueltas o el 
sujeto se ve seriamente privado de agua, cambiará la probabilidad relativa de 
correr y beber. Sin embargo, se supone que, en determinadas circunstancias, el 
punto de deleite conductual es fijo, como ocurre cuando no se ponen límites a las 
elecciones entre respuestas alternativas. La teoría de la regulación conductual sos- 
tiene, además, que el punto de deleite conductual será defendido contra las altera- 
ciones causadas por las limitaciones en la oportunidad de dar respuestas concre- 
tas. Esas limitaciones a veces son impuestas por los procedimientos de condiciona- 
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miento instrumental porque los procedimientos instrumentales no permiten a los 
sujetos acceder a la respuesta reforzadora a menos que hayan ejecutado previa- 
mente la respuesta instrumental de la forma requerida. 

La teoría de la regulación conductual es similar, en cierto sentido, a la regula- 
ción fisiológica homeostática. Consideremos, por ejemplo, los mecanismos ho- 
meostáticos para el mantenimiento de la temperatura corporal. En los humanos, 
la temperatura mormal del cuerpo es de 362%C. Esta temperatura óptima se 


defiende contra las alteraciones a través de varios mecamismos homeostáticos. Si 


entramos en una cámara refrigeradora nuestro cuerpo se defiende contrayendo los 
capilares sanguíneos superficiales, temblando, etcétera. S1 entramos en una sauna, 
la temperatura del cuerpo se defiende a través de la vasodilatación y el sudor. 
Normalmente, los mecanismos homeostáticos que defienden la temperatura cor- 
poral son muy eficaces, hasta el punto de que la temperatura corporal no cambia a 
pesar de las grandes variaciones en la temperatura ambiental. El punto de deleite 
conductual es semejante a la temperatura corporal óptima. Se defiende contra las 
alteraciones en la oportunidad de dar respuestas diversas. Como veremos, a dife- 
rencia de los mecanismos homeostáticos fisiológicos que pueden mantener con 
éxito un punto óptimo fijo, la regulación conductual no puede siempre hacer que, 
frente a las alteraciones causadas por las contingencias instrumentales respuesta- 
reforzador, el animal retorne a su punto de deleite conductual de la línea de base 
libre. 

El punto de deleite conductual se puede definir en términos de la frecuencia 
relativa de aparición de todas las respuestas de un organismo en una situación en 
la que no se ponen límites. Para simplificar el análisis, vamos simplemente a 
centrarnos en dos respuestas, correr y beber, como en los experimentos de Pre- 


Figura 7.4.— Distribución de la 
conducta entre beber y correr, El 
círculo abierto señala la distribu- 
ción Óptima, o punto de satisfac- 
ción conductual, obtenida en una 
sesión de línea de base libre. Las 
líneas A, B y € representan dife- 
rentes relaciones impuestas de 
contingencia entre beber y co- 
rrer. La contingencia represen- 
tada por la línea Á restringe la 
bebida, pues el animal debe co- 
rrer el doble para mantener la 
cantidad óptima de bebida. La 
contingencia representada por la 
Se restringe línea € restringe el correr ya que 
el beber exige al animal que beba el do- 
ble para mantener la cantidad 
óptima de carrera. La línea B, 
que pasa por el punto de satis- 
facción, sólo requiere que el ani- 
mal haga lo que prefiera y por 
tanto no se ejercen restricciones. 
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mack ilustrados en la figura 7.2. Si no se ponen restricciones a correr y beber, esas 
actividades pueden suceder sin que exista una relación entre ellas. Los animales 


pueden correr mucho y beber mucho, correr mucho y beber poco, correr poco y: 


beber mucho, o correr poco y beber poco. La figura 7.4 representa la cuantía de la 
conducta de correr en el eje horizontal, y la cuantía de la conducta de beber en el 
eje vertical. S: no se ponen límites, lo que corre y bebe un sujeto podría caer en 
cualquier punto de este eje de coordenadas. Vamos a suponer que la conducta de 
un sujeto en una situación de línea de base libre se representa por un círculo 
abierto. El sujeto bebe 15 segundos y corre 15 segundos durante nuestro período 
de observación. Esto define el punto de deleite conductual del sujeto en esta situa- 
ción. ¿Cómo se alteraría el deleite conductual mediante la introducción de una 
contingencia instrumental entre correr y beber? Esto depende de la naturaleza de 
la contingencia. 

La figura 7.4 muestra tres posibles relaciones contingentes entre correr y 
beber. En la figura se representan por las líneas continuas que salen del vértice. 
Estas líneas especifican lo que tiene que correr el animal para obtener una cantí- 
dad concreta de tiempo para beber. Así pues, estas líneas son funciones retroali- 
mentadoras (véase «Mecanismos de la ley de la igualación», capítulo 6). La 
línea B representa una contingencia en la cual se necesita un segundo de carrera 
por cada segundo de oportunidad para beber. La línea B atraviesa el punto de 
deleite de correr y beber que se obtuvo en condiciones de línea de base libre. Esto 
hace que la contingencia representada por la línea B sea bastante especial porque 
permite al sujeto alcanzar el punto de deleite conductual y al mismo tiempo cum- 
plir la contingencia respuesta-reforzador. Las contingencias representadas por las 
líneas A y € no pérmiten eso. 

La línea A designa una contingencia en la que el sujeto tiene que correr el 
doble de lo que bebe. 7,5 segundos de beber suponen 15 segundos de correr. Dado 
que el punto de deleite conductual es de 15 segundos para beber por 15 segundos 
para correr, la contingencia especificada en la línea A implica una restricción en 
la bebida. La línea C representa un tipo distinto de restricción. Aquí, el sujeto 
tiene que beber el doble de lo que corre. Así pues, por 7,5 segundos corriendo 
tiene que beber 15 segundos. En este caso la contingencia respuesta-reforzador 
implica una restricción de correr en relación con el punto de deleite conductual. 
Las líneas A y C representan los procedimientos de condicionamiento instrumen- 
tal que desafían el mantenimiento del punto de deleite conductual. 

La teoría de la regulación conductual afirma que los sujetos se defienden de los 
desafíos al punto de deleite conductual, exactamente igual que la regulación fisio- 
lógica supone una defensa contra los desafíos al punto de equilibrio fisiológico. 
Sin embargo, lo interesante es que el punto de deleite conductual de la línea de 
base no puede siempre restablecerse después de que se introduce una contingencia 
instrumental. En nuestro ejemplo, el punto de deleite conductual era de 15 
segundos para beber y de 15 segundos para correr durante un período de observa- 
ción estándar. Consideremos lo que puede ocurrir cuando el programa de refor- 
zamiento representado por la línea C en la figura 7.4 se impone sobre la situación 
de respuesta libre. Ahora el sujeto no puede lograr deleite en relación con el 
correr sin desviarse significativamente del nivel óptimo de bebida, y viceversa. Ya 
que la contingencia de la línea C requiere el doble de beber que de correr, para 
conseguir el nivel óptimo de 15 segundos de correr el sujeto tendría que beber 30 
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segundos, dos veces su nivel óptimo. O si el sujeto lograra sus 15 segundos Ópti- 
mos de bebida, su conducta de correr estaría en 7,5 segundos, la mitad del nivel 
óptimo. La línea A representa problemas similares para retornar al punto de 
deleite conductual. Los límites de la contingencia respuesta-reforzador impiden al 
sujeto lograr deleite en relación con una respuesta sin desviarse significativa- 
mente del nivel óptimo para la otra conducta. Los programas de reforzamiento 
como los representados por las líneas A y C de la figura 7.4 impiden que los 
sujetos vuelvan a su punto de deleite conductual. Sin embargo, esto no significa 
que la vuelta al punto de equilibrio conductual sea irrelevante en esos Casos; por 
el contrario, es la fuerza que impulsa la conducta motivada. La teoría de la regula- 
ción conductual sostiene que volver al punto de equilibrio conductual sigue 
siendo un objetivo de la distribución de las respuestas. Cuando este objetivo no se 
puede alcanzar, la redistribución de las respuestas entre las conductas instrumen- 
tal y contingente se convierte en un asunto comprometido. Aunque la distribución 
resultante de la conducta pueda no ser Óptima para ninguna de las respuestas 
consideradas por separado, puede ser Óptima en términos de lo que es posible 
para ambas respuestas juntas, dados los límites del procedimiento de condiciona- 
miento instrumental. Staddon, por ejemplo, ha propuesto un modelo de desvia- 
ción mínimo de regulación conductual (Staddon, 1979; véase también Staddon, 
1983). De acuerdo con este modelo, la introducción de una contingencia respues- 
ta-reforzador hace que los sujetos redistribuyan su conducta entre las respuestas 
instrumentales y contingentes de forma que se minimice la desviación total de las 
dos respuestas respecto al punto óptimo. Para situaciones en las cuales el punto 
de deleite conductual de la línea de base no puede lograrse, el modelo de desvia- 
ción mínima ofrece una visión acerca de la forma en que los sujetos se organizan 
para obtener la siguiente mejor cosa. 

Las teorías económicas de la distribución de la respuesta y las teorías del 
abastecimiento óptimo también consideran los factores que son relevantes en la 
redistribución de las respuestas causadas por un programa de reforzamiento. En 
las secciones siguientes vamos a discutir estos factores. 


¿De qué forma se producen los efectos del reforzamiento a través de la regu- 
lación conductual? Hemos considerado la regulación conductual como la defensa 
de un punto de deleite conductual frente a las restricciones en las oportunidades 
de respuesta impuestas por una contingencia respuesta-reforzador, y hemos 
advertido que a menudo esta defensa implica organizarse no para alcanzar el 
punto de deleite de línea de base libre, sino la mejor cosa posible en esa situación. 
¿Cómo llevan esos mecanismos a aumentos en la conducta instrumental en los 
procedimientos típicos de condicionamiento instrumental? El efecto del reforza- 
miento se identifica por un aumento en la aparición de una respuesta instrumen- 
tal respecto a los niveles con que aparecía en ausencia de una contingencia 
respuesta-reforzador. Como ilustra la figura 7.4, las funciones retroalimentadoras 
que no atraviesan el punto de deleite conductual invariablemente limitan una 
respuesta, quedando su nivel de aparición por debajo del nivel especificado por el 
punto de deleite. En la línea A de la figura 7.4, por ejemplo, la conducta de beber 
del sujeto está limitada en relación con la conducta de correr. Para acercarse lo 
más posible al punto de deleite conductual, el sujeto tiene que aumentar la con- 
ducta de correr de forma que consiga más oportunidades para beber. Eso es prec!- 
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samente lo que ocurre en los procedimientos típicos de condicionamiento imstru- 
mental. El acceso al reforzador se restringe; para tener más oportunidades de dar 
la respuesta reforzadora, el sujeto tiene que aumentar la ejecución de la respuesta 
instrumental. El aumento en la ejecución de la respuesta instrumental (producto 
del reforzamiento) es un efecto de los mecanismos reguladores de la conducta que 
funcionan para minimizar las desviaciones del punto de deleite conductual. 


Comparaciones entre la regulación conductual y las teorías tradicionales del 
reforzamiento. La teoría de la regulación conductual supone una desviación fun- 
damental de las nociones tradicionales del reforzamiento. Es un desarrollo revolu- 
cionario dentro de la teoría del reforzamiento. Varios aspectos de la teoría se 
oponen a las teorías tradicionales del reforzamiento. En primer lugar, la teoría de 
la regulación conductual no considera el reforzamiento como la presentación de 
un tipo especial de estímulo o un tipo especial de oportunidad de respuesta. Ántes 
bien, de acuerdo con la teoría de la regulación conductual, el reforzamiento es el 
resultado de una interacción entre la distribución óptima de la conducta, según se 
mide en la línea de base libre de respuesta, y las restricciones en las oportunida- 
des de respuesta impuestas por un programa de reforzamiento. Así pues, los 
efectos del reforzamiento dependen estrechamente de las preferencias en la línea 
de base. Una consecuencia es que los efectos del reforzamiento son específicos 
para unas condiciones concretas en la línea de base. Debemos esperar que las 
circunstancias que cambien las preferencias en la línea de base (la introducción, 
por ejemplo, de nuevas posibilidades de respuesta), cambien también los efectos 
del reforzamiento. Es decir, en contraste con la teoría de la reducción del impulso, 
la teoría de la regulación conductual no considera que los reforzadores que son 
eficaces en una situación lo van a ser eñ otras. 

Una segunda diferencia importante es que la teoría de la regulación conduc- 
tua! no sostiene que los procedimientos de condicionamiento instrumental «estam- 
pen» una conducta instrumental. Antes bien, se considera que el condiciona- 
miento instrumental crea una nueva distribución, o reparto, de las respuestas. 
Una tercera diferencia importante es que la teoría de la regulación conductual no 
hace una distinción entre respuestas instrumentales y reforzadoras. No considera 
que las respuestas reforzadoras tengan más probabilidades que las respuestas ims- 
trumentales de producir beneficios fisiológicos especiales, o que posean caracterís- 
ticas inherentes que las haga distintas de las respuestas instrumentales; las res- 
puestas instrumentales y las reforzadoras se distinguen sólo por los papeles que 
les son asignados por una contingencia instrumental. La contingencia instrumen- 
tal requiere niveles de la respuesta reforzadora menores que los de la línea de 
base, para que el sujeto realice la respuesta instrumental con una tasa superior a 
la de la línea de base. Por último, la teoría de la regulación conductual concibe los 
efectos de reforzamiento, simplemente, como una manifestación de la forma en 
que los animales se esfuerzan por distribuir sus respuestas entre las alternativas 
para alcanzar la posibilidad mejor. Así pues, la regulación conductual es parte de 
una adaptación total del organismo a su ambiente (véase Staddon, 1983, para un 
tratamiento amplio de la conducta instrumental como adaptación). 
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Las teorías de la regulación conductual implican una interacción entre las pre- 
ferencias del sujeto y las restricciones impuestas por un programa de reforza- 
miento. Como hemos visto, es habitual que los programas no permitan que el 
sujeto alcance su distribución preferida de conducta (el punto de deleite). Los 
psicólogos han mostrado interés por descubrir los principios que determinan la 
forma en que cambia la conducta como resultado de los límites impuestos por el 
programa. Las personas que han estudiado economía pueden reconocer aquí una 
semejanza con los problemas en microeconomía del aporte de trabajo y la 
demanda del consumidor. Los economistas, como los psicólogos, se esfuerzan por 
comprender los cambios en la conducta en términos de preferencias y restriccio- 
nes a la satisfacción de esas preferencias. Algunos psicólogos se han interesado en 
esta clase de problemas. En el análisis de la conducta resulta atractivo utilizar 
conceptos económicos porque la econornía ofrece teorías y modelos matemáticos 
sumamente desarrollados. Vamos a considerar cómo han influido las ideas eco- 
nómicas en las teorías del reforzamiento, en concreto en la regulación conductual. 
Por razones de simplicidad, mos concentraremos en las ideas básicas que han 
tenido más importancia para la comprensión del reforzamiento. 


El aporte de trabajo. En 1953 Skinner sugirió que los programas de refor- 
zamiento eran similares a los del trabajo humano para obtener un salatio. Por 
ejemplo, podemos pensar que la presión de la barra de las ratas es una forma de 
ganar comida exactamente igual que el trabajo a destajo en una fábrica es una 
forma de ganar dinero. El número de presiones de la barra que se necesitan para 
obtener una bolita de comida es análogo, pues, al nivel de la paga, o al salario. Los 
economistas han estudiado cómo los distintos niveles salariales influyen en la 
cantidad de trabajo de una persona (el aporte de trabajo). La relación entre la 
cantidad de trabajo que se realiza según los distintos niveles de salario y la canti- 
dad total ganada con esas tasas salariales se llama curva del aporte de trabajo. La 
figura 7.6 muestra una curva teórica del aporte de trabajo. Cada una de las líneas 
que radian desde el vértice representa un nivel salarial diferente. La línea 1 (L1), 
por ejemplo, representa una tasa salarial alta, pues aquí las gamancias aumentan 
rápidamente con aumentos sólo pequeños en el trabajo. La línea 5 (L5), por el 
contrario, representa salarios muy bajos. Aquí se gana muy poco dinero adicional 
por aumentos grandes en el trabajo. Los puntos en cada línea representan la 





APARTADO 7.2. Regulación conductual y conducta humana 


Aunque la mayoría de las investigaciones sobre las teorías de la regulación conductual 
del reforzamiento se han realizado con sujetos animales, los principios también se aplican 
a la conducta humana. En una simación determinada, las personas también tienen una 
forma preferida, o lo que para ellos es óptima, de distribuir sus actividades entre las 
alternativas disponibles. Si se introduce uma contingencia respuesta-reforzador, reajustan 
su conducta para encontrar una mueva distribución de actividades más cómoda, dadas las 
restricciones impuestas por el procedimiento instrumental. 

Bernstein y Ebbesen (1978) imvestigaron la redistribición de las respuestas en tres 
adultos a los que se les pagó para que vivieran individualmente en un laboratorio 24 horas 
al día durante varias semanas. Un sujeto era una chica de 19 años sin bachiller, otro era un 
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Figura 7.6.—Curva estándar idea- 


constructor de 39 años, y el tercero un trabajador de la construcción desempleado de 26 
lizada del aporte de trabajo, que 


años. El laboratorio ofrecía todas la ñ 
s comodidades de un pequeño apartamento: mesas, Niveles salariales : 
L, TA Aecrecientes muestra el trabajo que uno esta- 
L, 


sillas, sofá, cama, nevera, cuarto de baño con ducha, utensilios de cocina, etcétera. Los 
sujetos eran observados desde la habitación contigua a través de una ventana con visión en 
una sola dirección. Después de observar la distribución de la conducta en esa situación sin 
restricciones —línea de base libre-——, los experimentadores impusieron una contingencia 
respuesta-reforzador. La figura 7.5 muestra los resultados de un experimento de S ti 
en el que se emplearon coser o hacer punto y estudiar ruso. El círculo abierto re a 
los nuveles de la línea de base libre de esas actividades. Los sujetos pasaban he más 
tiempo cosiendo o haciendo punto que estudiando ruso. Se impuso, entonces, una contin- 
gencia instrumental que requería de los sujetos que estudiaran ruso antes de poder coser O 
hacer punto. La línea continua en la figura 7.5 ifustra fa contingencia. La contingencia 
Par una restricción a coser y hacer punto. Si el sujeto estudiaba tanto E la 
Ínea de base, podía coser o hacer punto mucho menos que durante la línea de base. El 
círculo OSCUFO de la figura 7.5 ilustra la redistribución de la conducta que resultaba de la 
introducción de esa contingencia. El sujeto aumentaba su estudio, pero no lo suficiente 
como para pasar tanto tiempo cosiendo o haciendo punto como en la fase de la línea de 
base. Así pues, la contingencia instrumental producía un cambio en ambas respuestas: la 
conducta de baja probabilidad (estudiar) aumentaba, y la conducta de alta robabilid d 
(coser y hacer punto) descendía. a En 
Otra observación fascinante en el experimento fue que los sujetos redistribuían su 
o acuerdo con una contingencia instrumental, aun cuando ellos se resistían a la 
encia y, a v 1sti já j ¡ 
Na Ercin d a a rara e a Un sujeto trató de resis- cantidad total ganada con cada nivel salarial. Los puntos conectados entre sí for- 
coser. Después de no coser durante 11 hna al final se e dió y dec NE e man una curva de aporte de trabajo. 
os a e y cosió un poco, después de ] Vamos a considerar lo que ocurre según una curva de aporte de trabajo teórica 
e - Aparentemente, la perspectiva de | E 76). E al 
una vida sin coser era peor que la de rendirse a las limitaciones de la respuesta impuestas (cuando vamos de Ll a E5 en la figura 7.6). Al pasar de un nivel salarial alto (L1) 
a | a un nivel ligeramente más bajo (L2), vemos que las personas tratan presumi- 
blemente de mantener sus ganancias totales trabajando más (aumentando el tra- 
bajo total realizado). A medida que los niveles salariales van bajando (L2 a 14), 
las personas continúan aumentando su esfuerzo de trabajo para compensar el 
descenso de los niveles salariales. Sin embargo, el aumento del esfuerzo no es 
suficiente para mantener las ganancias totales en su cuantía original. Cuando los 
niveles salariales se hacen muy bajos (línea 5 en la figura 7.6), el trabajo total 
realizado ya no aumenta más que para compensar los bajos salarios. De hecho, 
ocurre justo lo contrario. El trabajo total realizado desciende por primera vez. Así 
pues, se supone que los descensos en los niveles salariales dam como resultado 
aumentos en el trabajo total realizado hasta un punto (L1 a L4), después del cual 
el trabajo total realizado desciende (L5). A causa de esta inversión, la curva del 
aporte de trabajo es conocida como «curva hacia atrás». 
La teoría microeconómica predice curvas del aporte de trabajo de curvatura 


ría dispuesto a hacer y los suel- 
dos totales ganados, en función 
de los niveles salariales (repre- 
sentados por las líneas rectas 
que irradian desde el origen). La 
línea L1 representa el nivel sala- 
rial más alto, la línea L5 el más 
bajo. 
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hacia atrás, como las de la figura 7.6. Se han obtenido también estas curvas en las 
investigaciones de condicionamiento instrumental con sujetos animales. Kelsey y 
Allison (1976), por ejemplo, realizaron un experimento con ratas que presiona- 
ban una palanca para obtener una recompensa de sucrosa. El «nivel salarial» se 
varió cambiando el número de presiones de la palanca que se exigían para obte- 
ner diez lamidas de sucrosa. A medida que aumentaba el requerimiento de pre- 
siones de palanca, al principio el número total de presiones de la palanca (el total 
del trabajo realizado) iba aumentando, pero después descendía, como en las cur- 
vas de aporte de trabajo con curvatura hacia atrás. 
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Figura /-5.—Distribución del comportamiento entre estudiar ruso y coser O hacer punto en 

condiciones de línea de base libre, y bajo la contingencia instrumental impuesta por los 

Investigadores (línea continua). El círculo vacío representa los valores a en la 

linea de base libre; el círculo negro representa los valores observados después de ser 

impuesta la contingencia. (Según Allison, 1983, a su vez adaptado de Bernstein y Ebbesen, 
1978.) 
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¿Por qué la curva de aporte de trabajo se dobla hacia atrás? Los economistas 
nos dicen que este efecto tiene relación con la preferencia de las personas por el 
trabajo y sus recompensas en comparación con el deseo de ocio. Con niveles 
salariales diferentes, son posibles cantidades de dinero y de ocio diferentes. 
Cuando los niveles salariales son altos, los trabajadores tienen, sin problemas, 
dinero y ocio. Conforme desciende su nivel salarial, los trabajadores tienen que 
abandonar cada vez más el tiempo de ocio para mantener unas ganancias razona- 
bles. Cuando la tasa de rendimiento por el esfuerzo del trabajo se hace muy baja, 
la gente empieza a no desear dejar el ocio para ir al trabajo, y el trabajo total que 
se realiza desciende. En este momento, la curva de oferta de trabajo se dobla hacia 
atrás. El momento de la inversión depende de lo que cada uno valore el ocio en 
comparación con las ganancias monetarias. 

Los experimentos de condicionamiento instrumental pueden interpretarse de 
forma similar. En el estudio de Kelsey y Allison (1976), por ejemplo, las ratas 
distribuían su tiempo entre el ocio y la presión de la palanca para obtener sucrosa. 
Las actividades de ocio en una caja de Skinner consisten en oler, explorar, asearse, 
etcétera. Cuando el número de presiones de la palanca que se requería para obte- 
ner la sucrosa se hacía demasiado alto predominaban las actividades de ocio, y las 
ratas disminuían las presiones de la barra. 

Como otras reglas para la regulación conductual, la teoría del aporte de tra- 
bajo conjuga las preferencias del organismo con las restricciones del programa. 
Sin embargo, este enfoque difiere de forma esencial de otros que hemos descrito. 
Anteriormente habíamos centrando nuestro interés sólo en las respuestas ins- 
trumentales y reforzadoras implicadas en un procedimiento de condicionamiento 
instrumental. Con el aporte de trabajo introducimos un tercer tipo de conducta, la 
actividad de ocio. 


pd 

Demandas del consumidor. En la sección anterior hicimos uso de la teoría 
económica para establecer una analogía entre la conducta instrumental y el tra- 
bajo. Otro enfoque establece una analogía entre la conducta instrumental y el 
consumo de bienes. La teoría de la demanda del consumidor describe los factores 
que influyen en la cantidad de tiempo que una persona dedica a los distintos 
artículos de consumo. Al tomar prestada la teoría de la demanda del consumidor, 
los psicólogos han igualado el tiempo dedicado a responder (o el número de 
respuestas realizadas) con el dinero. En esta analogía, el tiempo total disponible 
para responder o el número total de respuestas que el sujeto puede dar es equiva- 
lente a los ingresos (la cantidad total de dinero que uma persona dispone para 
gastar). El «precio» de un reforzador es el tiempo, o número, de respuestas pre- 
ciso para obtenerlo, como ya se especificó en el procedimiento de condiciona- 
miento instrumental. El objetivo es determinar cómo está controlada la conducta 
instrumental («el gasto») por las contingencias («los precios»). 

La relación entre la cantidad de artículos que se adquieren y su precio se 
expresa en una curva de demanda. A veces, el consumo de un artículo está clara- 
mente influido por su precio. Si el precio de un «caramelo de peseta» aumenta, 
podemos comprar menos. Otros artículos tienen menos relación con los cambios 
de precio. El grado en que el precio influye en el consumo se llama elasticidad de 
la demanda. La demanda de un caramelo de peseta es elástica, Cuanto más cueste 
un caramelo, menos caramelos compraremos. La demanda de agua, sin embargo, 
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no es elástica. Seguiremos adquiriendo agua aunque su precio aumente mucho. De 
forma análoga, la demanda de reforzadores puede ser elástica y no elástica. 51 
aumentamos el número de presiones de la palanca necesario para obtener comida 


-y encontramos que una rata simplemente aumenta sus respuestas, esto demuestra 


que la demanda de comida no es elástica. La demanda de comida no disminuye en 
función del precio. Puede ser más elástica la realización de otras conductas, como 
correr dentro de una rueda. ] e 

¿Qué determina la elasticidad de la demanda? Los economistas han identifi- 
cado tres factores. Uno es nuestros imgresos. Si Somos muy ricos podemos conti- 
nuar comprando globos aunque el precio suba por las nubes. Un segundo factor es 
el precio mismo. La demanda de un caramelo puede ser no elástica por debajo de 
cinco pesetas, pero elástica por encima de cien. El tercero y más importante factor 
para nuestros propósitos es que haya sustitutos disponibles. 


Sustituibilidad. Muchas personas encuentran que el té es un buen sustituto 
del café. Por tanto, cuando el precio del café sube, esas personas disminuyen su 
consumo de café y se pasan al té. Sin embargo, si ocurre que nos gusta el té, 
podemos seguir comprando café a precios altos. Nuestra demanda de café sería no 
elástica. De forma semejante, si una rata sólo puede obtener su comida diaria 
presionando la barra para obtener las bolas de comida, su demanda de comida, 
muy probablemente, no será elástica (para una revisión, véase Lea, 1978). Sin 





APARTADO 7.3. La economía de fichas como laboratorio económico: contingencias que 
se vuelven en contra 


Los principios del condicionamiento instrumental han sido aplicados extensamente en 
los hospitales psiquiátricos o a través de la economía de fichas. El objetivo de la economía 
de fichas es conseguir que los pacientes con un bajo rendimiento dediquen más tiempo a 
las acrividades de la vida diaría (comer adecuadamente, asearse, vestirse, etcétera). Esto se 
realiza reforzando con fichas determinadas conductas. Las fichas pueden después cambiarse 
por reforzadores primarios: cigarros, privilegios, comida y mejores sitios para dormir, 
etcétera. , 

Aparte de su valor terapéutico (por ejemplo, Ayllon y Azrin, 1968; Kazdin, 1977), las 
economías de fichas suministran un laboratorio para estudiar la economía conductual 
(véase Winkler, 1980). En uno de los estudios, la forma de la curva de aporte de trabajo 
era un factor importante para comprender los efectos de las fichas (Barralio, Kagel y 
Winkler, 1975). En este estudio, el nivel salarial (en fichas) por lavarse los dientes se 
cambió de cero a cinco fichas, mientras que los salarios para otras actividades se mantenían 
constantes. Como era de prever, el lavado de los dientes aumentó al aumentar el salario. La 
parte interesante del estudio, sin embargo, fue que en los niveles de salario más altos, la 
conducta general cambiaba según el nivel de ingresos del paciente. Los pacientes que 1ni- 
cialmente tenían niveles de ingresos bajos porque no trabajaban en otras tareas aumenta- 
ban sus ingresos totales lavándose los dientes. Los pacientes de ingresos altos, sin 
embargo, no se hacian más ricos. Sus ingresos permanecían constantes. Cuando los niveles 
salariales por lavarse los dientes eran altos, dejaban de ganar fichas con otras actividades. 
Como predice la curva de aporte de trabajo, sustituían las tareas de paga más baja por 
tiempo de «ocio». Considerando globalmente la situación, el efecto terapéutico se ponía en 
peligro en este grupo por las altas tasas salariales por lavarse los dientes. Aunque esos 
pacientes se lavaran los dientes, participaban en otras conductas tratadas con las mismas 
bajas tasas que habían mostrado antes de que se introdujeran los procedimientos de 
reforzamiento. 
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embargo, si está a su disposición otra fuente de comida, y con un programa de 
reforzamiento más fácil, la demanda de bolitas de comida ofrecerá una mayor 
elasticidad, o disposición para responder a pesar de los cambios de programa (Lea 
y Roper, 1977). 

Dos expertmentos realizados por Kagel y otros (1975) ilustran adecuada- 
mente los efectos de la sustitutbilidad. Las ratas vivían en cajas de Skinner con 
dos palancas. Á cada rata se le permitía realizar, o «gastar», un número fijo de 
presiones en la palanca por día (ingresos diarios). En el primer experimento, 
presionar una palanca proporcionaba bolas de comida seca, mientras que presio- 
nar la otra palanca proporcionaba agua. En el segundo estudio, las presiones de la 
palanca se podían «gastar» en dos bebidas dulces. Las bolitas de comida y el agua 
son sustitutos pobres uno de otro. De hecho, estos artículos son probablemente 
complementarios. Es decir, cuanta más comida seca comamos, más necesitaremos 
beber. Por el contrario, las dos bebidas dulces utilizadas en el segundo estudio 
eran, seguramente, buenos sustitutos uno del otro. En ambos experimentos el 
precio de los reforzadores se aumentó aumentando el requerimiento del pro- 
grama. En el primer experimento, los cambios en el «precio» no se vieron acom- 
pañados de cambtos en el consumo de comida. Las ratas no sustituían la. comida 
«más cara» por el agua «más barata». La demanda de comida no era elástica. Por 
el contrario, en el segundo experimento se produjo una sustitución. Cuando el 
precio de una de las bebidas dulces aumentaba, las ratas dedicaban la mayoría de 
sus respuestas a obtener la otra bebida. La demanda de bebida dulce era elástica. 
(Véase Burkhard y otros, 1978, para un estudio de sustituibilidad en el condicio- 
namiento instrumental con niños.) 


La importancia de los modelos económicos para la regulación conductual. 
Como ya hemos visto, la teoría económica ha proporcionado a los psicólogos 
nuevas formas de analizar la regulación conductua!. Como ocurre con otros enfo- 
ques de la regulación conductual, los modelos económicos sostienen que la con- 
ducta cambia para que algo llegue al máximo. Qué es ese algo depende de en qué 
nos fijemos. En la analogía del aporte de trabajo, la distribución entre ganancias y 
ocio llega al máximo. En la analogía de la demanda de artículos, el valor del gasto 
conductual total se hace máximo. La teoría económica ha facilitado formas nuevas 
y precisas de describir los límites que imponen los distintos procedimientos de 
condicionamiento instrumental sobre el repertorio conductual del organismo. Y 
lo que es más importante, sugiere que la conducta instrumental no puede ser 
descrita de forma sesgada. Antes bien, el repertorio total del organismo en un 
momento dado tiene que considerarse como un sistema (Rachlin, 1978; Rachlin y 
Burkhard, 1978). Los cambios en una parte del sistema provocan cambios en las 
otras partes. Los límites impuestos por los procedimientos instrumentales son 
más o menos eficaces dependiendo de las características de la conducta no limi- 
tada. Los psicólogos acaban de empezar a presentar de forma documentada los 
efectos de la sustituibilidad y otras interacciones de los sistemas conductuales. 





PRINCIPIOS DE APRENDIZAJE Y DE CONDUCTA 263 
La teoría del abastecimiento óptimo y la regulación conductual 
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Esgura 7.7.—Caja experimental en la que los animales permanecen un largo período, sin recibir seña- 
les del paso del tiempo. El animal busca un trozo de comida completando el requerimiento operante 
en la «barra de búsqueda», que está activa cuando se ilumina la luz montada sobre ella. La iluminación 
de una secuencia de luces en el extremo opuesto de la jaula indica que el trozo de comida ha sido 
obtenido como resultado de esta búsqueda; cada una de las secuencias de luces indica el coste para el 
animal de obtener el trozo que ha sido encontrado. El animal identifica la naturaleza del alimento 
encontrado en términos de su coste, y puede obtenerlo, bien completando el número apropiado de 
presiones en la «barra de obtención», bien volviendo a buscar en la «barra de búsqueda», lo que le 
Podría permitir encontrar un tipo de comida menos costoso. Cuando se ha conseguido la comida se 
abre la puerta del túnel de alimentación y el animal puede comer tanto como quiera (esto es estar 
comiendo todo el tiempo que desee), pues la puerta del túnel sólo se cerrará cuando el animal haya 
permanecido fuera de éste diez minutos o más. El agua está continuamente disponible, y se pueden 
colocar pesos en cualquiera de las dos barras para manipular el coste del alimento con independencia 
del tiempo necesario para completar los requerimientos de presión de la barra. (Según Collier, 1983.) 


George Collier y sus colaboradores (por ejemplo, Collier, 1983) han ideado un 
modelo de laboratorio para el estudio del abastecimiento en las ratas que se ilus- 
tra en la figura 7.7. La cámara experimental tiene dos palancas de respuesta en 
paredes opuestas. La palanca de la derecha se designa como barra de «búsqueda». 
Las respuestas efectuadas aquí se consideran análogas a la búsqueda de una pieza 
de comida. Cuando se realiza la conducta de búsqueda requerida se iluminan unas 
claves luminosas en la pared contraria, señalando que se ha encontrado una 
«presa», O fuente de comida. La configuración concreta de las claves cercanas a la 
barra de obtención de comida indica la cantidad de respuestas que el sujeto tiene 
que realizar para obtener una «presa». Llegado este punto, el sujeto es libre de 
realizar las respuestas de obrención que se requieren, o puede volver a la barra de 
«búsqueda» con la esperanza de encontrar una «presa» que le sea más fácil de 
obtener. 

El modelo de laboratorio que se muestra en la figura 7.7 permite estudiar 
varios factores de potencial importancia en las situaciones de abastecimiento. Por 
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ejemplo, la conducta de «búsqueda» (responder en la barra de «búsqueda») puede 
ser investigada en función del coste de la búsqueda (determinado por el programa 
de razón programado en la barra de «búsqueda»), el coste de obtención, la abun- 
dancia relativa de las comidas de bajo y alto coste de obtención, o el valor de la 
fuente de comida que puede obtenerse. Podemos también examinar los factores 
que influyen en la obtención de comida. Los estudios de abastecimiento con este 
método de laboratorio han mostrado que, en una amplia gama de circunstancias, 
las ratas y otras especies mantienen su ingestión de comida de forma que sea 
máxima la ganancia calórica en relación al coste de la respuesta. Por ejemplo, 
cuando los costes de la obtención de una «presa» aumentan es menos probable 
que los sujetos dediquen el esfuerzo requerido para obtener la comida, y preferi- 
rán volvéase a la búsqueda de otra presa. Sin embargo, este efecto del coste de la 
obtención depende en parte de los costes de la búsqueda. A medida que los costes 
de la búsqueda aumentan, aumenta la probabilidad de que el anima! se haga con 
cualquier comida que localice durante la conducta de búsqueda (véase Collier, 
1983, para más detalles y otros ejemplos). 

La teoría del abastecimiento trata algumos de los problemas destacados en 
otros análisis de distribución de la respuesta que ya hemos considerado. Por 
ejemplo, uno de los problemas fundamentales de la teoría del abastecimiento es 
saber cuándo un animal se va a mover de una fuente de comida a otra. Para 
muchos animales, la comida se distribuye en el ambiente en parcelas separadas 
(grupos de flores para una abeja, por ejemplo). Cuanto más tiempo permanezca 
un animal en una parcela de comida determinada, más se agotará esa parcela, y 
más difícil resultará encontrar comida. Este modelo es semejante al principio de 
disminución de la utilidad marginal propuesto por los teóricos de la economía. Se 
puede predecir que el momento en que el animal va a pasar de alimentarse en 
una parcela a alimentarse en otra depende del esfuerzo que le supone ir a la 
nueva parcela en comparación con el esfuerzo que implica la obtención de comida 
en la parcela habitual. Es predecible que el animal permanecerá en una parcela 
determinada hasta que el esfuerzo para obtener comida allí llegue a igualar el 
esfuerzo requerido para cambiar a la parcela siguiente (véase Krebs y McCleery, 
1984). 

Aunque en algunos aspectos la teoría del abastecimiento trata los mismos 
problemas que otras teorías de distribución de la respuesta, supone una perspec- 
tiva mucho más biológica del problema. La teoría del abastecimiento se refiere 
básicamente a la forma en que los animales obtienen la comida en la naturaleza. 
Como tal, la teoría del abastecimiento ofrece un puente interdisciplinario entre 
los estudios de campo y de laboratorio realizados por zoólogos y etólogos y las 
investigaciones psicológicas del problema de la distribución de las respuestas 
(Kamil y Yoerg, 1982; Shettleworth, 1984). Una contribución de esta perspectiva 
biológica es que plantea cuestiones sobre el rendimiento comparativo de diversas 
especies. La conducta de abastecimiento presenta formas diversas en el reino 
animal. Algunas clases de animales se alimentan sólo en ciertas estaciones. El 
ciervo y el alce, por ejemplo, comen en abundancia en primaverá y verano con el 
fin de almacenar reservas adiposas y minerales para el invierno. Los animales que 
sólo se alimentan de plantas (herbívoros) tienen que comer mucho para obtener 
una nutrición suficiente, dada la relativamente pobre calidad de esa comida. El 
coste de la respuesta de obtención de plantas suele ser bajo, pero los animales 
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tienen que comer con frecuencia. Por el contrario, los animales que cazan y comen 
otros animales (carnívoros) pueden mantenerse con mucha menos comida porque 
la calidad nutritiva de su comida es mucho mejor. Sin embargo, el coste de la 
obtención (el esfuerzo que se necesita para capturar una pieza) puede ser muy 
grande. La teoría del abastecimiento, con su perspectiva biológica, destaca el 
hecho de que una teoría completa de la distribución de las respuestas tendrá que 
atender a la diversidad de formas en que los animales obtienen comida en la 


naturaleza. 


EL REFORZAMIENTO COMO SELECCIÓN DE LA RESPUESTA 


Las teorías del reforzamiento que consideramos en la sección anterior se basa- 
ban en la premisa de que la distribución de la conducta frente a una restricción 
impuesta por una contingencia respuesta-reforzador puede explicarse como un 
proceso «racional» de optimización de beneficios. La suposición subyacente era 
que si en una situación concreta pudiéramos determinar claramente los costes y 
beneficios de las distintas formas posibles de distribución de las respuestas 
podríamos predecir perfectamente la conducta. Aunque esos análisis de la «con- 
ducta racional» permiten explicar en gran parte los diversos efectos de los proce- 
dimientos de condicionamiento instrumental, algunos efectos del reforzamiento 
serían, aparentemente, por completo «irracionales», pues no ayudan a que la con- 
ducta retorne a un punto de deleite de línea de base libre; además, no son una 
exigencia de la contingencia instrumental y, por tanto, implican un esfuerzo inne- 
cesario y, aparentemente, sin ningún propósito. 


La conducta adjuntiva inducida por el programa 


La mayor parte de la investigación sobre condicionamiento instrumental se 
realiza en situaciones de laboratorio provistas de pocas opciones de respuesta. La 
razón, sin duda, es minimizar la variabilidad de los datos. Cuando el ambiente se 
hace sólo un poco más complicado, se observan, a veces, efectos espectaculares. 
Por ejemplo, Falk (1961) añadió una botella de agua a cajas de Skinner en las que 
se reforzaba a las ratas con comida por presionar una palanca en un programa de 
intervalo variable. Aunque los animales no habían sido privados de agua, la con- 
sumieron en cantidades enormes. En algunos casos, ¡la ingestión de líquido 
durante una sesión de tres horas fue casi la mitad del peso del cuerpo de la rata! 
Este exceso en la bebida se denominó polidipsia inducida por el programa. La 


polidipsia inducida por el programa es particularmente curiosa porque desafía 


varias explicaciones fisiológicas y conductuales. No es resultado de los mecanis- 
mos fisiológicos de la sed conocidos. Ni parece ser producto de un reforzamiento 
“accidental, del condicionamiento clásico, ni de las respuestas mediadoras en la 
respuesta instrumental (para una revisión reciente, váase Cohen y Looney, 1984; 

- Roper, 1981; Wetherington, 1982). 
Beber no es el único tipo de conducta «extra» que se desarrolla en situaciones 
de reforzamiento. En ciertas especies de animales se ha observado agresión indu- 
cida por el programa (váase Looney y Cohen, 1982, para una revisión reciente). 
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era, 7.8, —Cantidad de conducta adjuntiva en tunción del intervalo de interreforzamiento 
atos de bebida inducida por el programa están tomados de Falk (1972). Los datos de agresión indu- 


cida por el programa están tomados de Flory (1969).] 


APARTADO 7.4. Conducta bumana inducida por el programa 


También en seres humanos se han observado conductas excesivas que no están diripi- 
das 2 Una tarea concreta, sino que son subproductos adjuntos a la tarea (por ejemplo 
ic y Bryan, 1982; Chereck, 1982; Kachanoff, Leveille, McClelland y Wayner, 

3, ace, Singer, Wayner y Cook, 1975). Cantor (1981) advirtió que durante la reali- 
mación de actividades rales como escribir, leer o vigilar, a menudo la gente incurre en 
crmalos os como morderse las uñas, mesarse los cabellos, agítarse, comer algo, fumar 
o se los 20 eq (eo aftno especia mente cuando la tarea es difícil). Estas actividades 

ucta . 
o ns a a Con adjuntiva de los animales sometidos a un programa de reforza- 

Cantor y Wilson (1984) han identificado numerosas situaciones laborales que esti 
lan la aparición de conductas adjuntivas excesivas debido a que el trabajo im lea eríodos 
de alta concentración seguidos de períodos de espera (como en los programas de refor o. 
miénto intermitente), Un ejemplo es el del trabajo con ordenadores Los eriodos d . 
introducción de datos, programación y corrección de errores se alternan con esperas : 
mientras el ordenador procesa la información o espera su turno en un sistema mulriusua. 
rio de tiempo compartido. Es frecuente que uno pase estos periodos de esper. ión. 
dose, comiendo, fumando o rascándose. pee 

Otro caso claro de conducra adjuntiva es el de los vendedores por teléfono. De nuevo 
aqu: nos Encontramos con periodos de actividad elevada (como cuando se comunican ¡ 
cliente las ventajas del producto) entre los que se intercalan períodos de espera (hast . 
responde alguien al teléfono, o mientras la persona pregunta a su Saya e) El do eN 
Michael Cantor observó que mucha gente dedicada a las ventas por teléfono asaba estos 

períodos de espera realizando conductas adjunrivas como fumar, comer algo 5h b caló 
Cierto trabajador llegó a beber veinte tazas de café al día. : o 


a _  _  Q-- _ —___—— 
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Los monos morderán un tubo de goma después del reforzamiento (Hutchinson, 
Azrin y Hunt, 1968). Las palomas atacarán a otras palomas o a un modelo dise- 
cado de paloma (por ejemplo, Campagnoni, Cohen y Yoburn, 1981; Gentry, 
1968). Los monos y las ratas masticarán lana (por ejemplo, Roper, Edwards y 
Crossland, 1983; Villarreal, 1967), y las ratas correrán en una rueda (Levitsky y 
Collier, 1968) o lamerán un chorro de aire (Mendelson y Chillag, 1970), cuando 
esas respuestas alternativas estén disponibles en la situación experimental. 

Falk (1972) ha sugerido que las respuestas anteriores se clasifiquen todas ellas 
como conducta adjuntiva porque presentan ciertas características similares. En 
primer lugar, todas se desarrollan durante la exposición a programas de reforza- 
miento intermitente aun cuando esas respuestas no intervengan en la obtención o 
consumo de! reforzador. Todas tienden a ser excesivas y a aparecer poco después 
del reforzamiento. Además, aunque la conducta adjuntiva se observa con los pro- 
cedimientos de condicionamiento instrumental dependientes de la respuesta, no 
parece que sea necesario el requerimiento de una respuesta. La entrega intermi- 
tente de comida, sin que sea necesaria una respuesta para obtener los reforzado- 
res, basta para producir conducta adjuntiva, Por último, la magnitud de la con- 
ducta adjuntiva está en relación con el intervalo entre las sucesivas presentaciones 
de comida. La figura 7.8 muestra el nivel de bebida y de agresión adjuntivas en 
función del tiempo entre los reforzadores. La conducta adjuntiva primero aumen- 
_ ta y después disminuye en función del intervalo interreforzamiento. 


Respuestas de ínterin y respuestas terminales 


La aparición de conducta inducida por el programa depende a menudo de la 
presencia de objetos que ofrezcan-una estimulación de apoyo a la conducta indu- 
cida por el programa: una botella de agua para beber, un trozo de madera para 
masticar, un modelo de otro animal para agredir, una rueda para correr dentro de 
ella, etcétera. Las presentaciones periódicas de reforzamiento pueden también 
inducir patrones de respuesta característicos, aun en ausencia de una estimulación 
de apoyo especial. Staddon y Simmelhag (1971) advirtieron por primera vez este 
tipo de conducta cuando estaban llevando a cabo un experimento para estudiar 
con más detalle el desarrollo de la conducta supersticiosa descrita previamente 
por Skinner (1948). Podemos recordar del capítulo 5 que Skinner alimentaba a las 
palomas cada 15 segundos, independientemente de lo que estuvieran haciendo. 
No se pidió a los sujetos que picotearan una tecla, o que realizaran cualquier otra 
respuesta, para obtener la comida. (Este tipo de programa se llama «programa de 
reforzamiento de tiempo fijo» [TF].) Al rato, Skinner volvía para váase qué esta- 
ban haciendo las palomas y advirtió que habían desarrollado los patrones caracte- 
rísticos de la conducta «supersticiosa». 

Staddon y Simmelbag (1971) repitieron el experimento de superstición de 
Skinner realizando observaciones más extensas y sistemáticas. Compararon la 
conducta de las palomas en tres programas de reforzamiento con comida. En dos 
de los programas se presentó la comida periódicamente con independencia de la 
conducta de la paloma. Uno de esos programas incluía una cantidad de tiempo fija 
entre los sucesivos reforzadores. Otro era un programa de tiempo variable inde- 
pendiente de la respuesta. El tercer programa era un programa estándar de inter- 
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Fsgrra 7.9.—Probabilidad de dis- 
tintas respuestas en función del 
tiempo entre las sucesivas entre- 
gas de un reforzador de comida, 
R1 (orientarse hacia la pared del 
almacén de comida) y R7 (pico- 
tear algo en la pared del alma- 
cén) son respuestas terminales, 
que tienen sus mayores probabi- 
lidades al final del intervalo de 
reforzamiento. R3 (picotear algo 
en el suelo), Rá (dar un cuarto 
de vuelta) y R8 (moverse a lo 
largo de la pared del almacén) 
son respuestas de ínterin, que 
tenen sus mayores probabilida- 
des a la mitad, más o menos, del 
intervalo de interreforzamiento. 
(Según Staddon y Simmefhag, 
1971, 


Probzbilidad de aparición 





Intervalo (seg) 


valo fijo en el que se pedía a las palomas que picotearan en la tecla de respuesta 
para obtener el reforzamiento. E 

Staddon y Simmelhag observaron atentamente la conducta de las palomas a lo 
largo de todo el experimento. Definieron y midieron la aparición de muchas res- 
puestas, tales como las respuestas de orientación al expendedor de comida, el 
picoteo en la tecla de respuesta, sacudir las alas, dar vueltas de un cuarto de 
círculo, y limpiarse. La frecuencia de cada respuesta se registró de acuerdo con el 
momento del intervalo entre las sucesivas presentaciones del reforzador en que 
aparecía. La figura 7.9 muestra los datos de distintas respuestas de una paloma. La 
figura muestra que algunas de las respuestas aparecieron principalmente hacia el 
final del intervalo entre dos reforzadores sucesivos. Por ejemplo, R1 y R7 (la 
orientación hacia los depósitos de comida y el picoteo a alguna cosa en la pared 
del depósito) tenían mucha más probabilidad de aparecer al final del intervalo 
interreforzamiento que en otros momentos. Staddon y Simmelhag las llamaron 
respuestas terminales. Otras actividades aumentaban su frecuencia después de la 
presentación de una recompensa y después descendían cuando se acercaba el 
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momento de la siguiente recompensa. Era más probable que las palomas dieran 
las respuestas R8 y Rá (moverse a lo largo de la pared del depósito y dar un 
cuarto de vuelta) hacia la mitad del intervalo de interreforzamiento. Estas activi- 
dades fueron denominadas respuestas de ínterin. No variaban mucho de una 
paloma a otra las acciones que eran respuestas terminales y las que eran respues- 
tas de ínterin. Por lo general, las respuestas terminales parecían incluir activida- 
des que forman parte del patrón de alimentación natural de la paloma: picotear, 
meter la cabeza en el expendedor de comida, etcétera. Por el contrario, las activi- 
dades no relacionadas con la comida, como asearse y dar vueltas, tendían a engro- 
sar la categoría de respuestas de ínterin. | 

Se comprobó que con los tres programas de reforzamiento se desarrollaban 
respuestas características de ínterin y terminales. Los resultados de los programas 
dependientes de las respuestas diferían de los resultados de los programas inde- 
pendientes de las respuestas (de tiempo fijo y de tiempo variable) sólo en que el 
picoteo de la tecla era siempre una respuesta terminal fuerte en el programa 
dependiente de la respuesta. Este resultado sugiere que una contingencia respues- 
ta-reforzador facilita la selección de una conducta terminal concreta a partir de 
todo el conjunto de posibles respuestas terminales. Por otra parte, Staddon y 
Simmelhag no hallaron pruebas de la existencia de fenómenos de reforzamiento 
accidental. Las respuestas no siempre aumentaban su frecuencia por el mero 
hecho de que coincidiera su aparición con la entrega de comida. Parece que la 
entrega de comida influía sólo en la intensidad de las respuestas terminales, 
incluso en las fases iniciales del adiestramiento. 

Investigaciones posteriores han proporcionado más pruebas de que las pre- 
sentaciónes periódicas de comida dan lugar a dos categorías de conducta, las res- 
puestas terminales, que aumentan conforme se acerca la entrega de la recompensa 
siguiente, y las respuestas de ínterin, que son anteriores en el intervalo interre- 
forzamiento (véase Anderson y Shettleworth, 1977 ; Innis, Reberg, Mann, Jacob- 
son y Turton, 1983; Innis, Simmelhag-Grant y Staddon, 1983; Reberg, Innis, 
Mann y Eizenga, 1978; Reberg, Mann e Innis, 1977). Más que mostrar patrones 
de respuesta idiosincráticos como los que advirtió Skinner (1948), todos los suje- 
tos mostraron esta distribución de conducta entre las respuestas terminales y de 
ínterin. Continúa siendo curiosa la falta de congruencia entre las observaciones 
contemporáneas de las respuestas terminales y de ínterin, y las observaciones de 
la conducta «supersticiosa» de Skinner. Skinner puede haber observado respuestas 
estereotipadas en sus sujetos porque centró su atención en aspectos diferentes de 
la conducta de sujetos diferentes. Puede que se haya centrado en una respuesta 
terminal de un sujeto, por ejemplo, y en diferentes respuestas de ínterin en otros. 
En cualquier caso, la investigación contemporánea no ha podido confirmar sus 
observaciones y ha puesto en cuestión su sugerencia de que el simple empareja- 
miento de una respuesta con un reforzador sea suficiente para fortalecer esa res- 
puesta. Pruebas recientes indican que para que se produzca el condicionamiento 
instrumental es necesario que exista también una relación contingente entre la 
respuesta y el reforzamiento (véase capítulo 5). 
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Un modelo de reforzamiento basado en la selección 
de la respuesta por evolución 


Las investigaciones sobre la conducta adjuntiva inducida por el programa y las 
respuestas terminales y de ínterin indican que, a lo largo del reforzamiento 
intermitente, los animales realizan múltiples cosas que no pueden ser interpreta- 
das como conducta «racional» dirigida a una meta, y diseñada para obtener el 
mayor rendimiento por el esfuerzo invertido. Cuando un reforzador se presenta 
de forma periódica se desarrollan respuestas terminales intensas y conducta 
adjuntiva, aun cuando tales respuestas no sean necesarias para la entrega de las 
recompensas. Además, tanto si se impone una contingencia respuesta-reforzador 
como si no, se desarrollan similares respuestas terminales y conducta adjuntiva 
(por ejemplo, Anderson y Shettleworth, 1977; Staddon y Simmelhag, 1971). 
Estos resultados sugieren que el desarrollo de respuestas terminales y conducta 
adjuntiva durante un programa de condicionamiento instrumental tiene poco que 
ver con la contingencia respuesta-reforzador. Por tanto, las teorías del reforza- 
miento que se han considerado hasta ahora no pueden explicar esas conductas. 

Staddon y Simmelhag (1971) propusieron un modelo alternativo de reforza- 
miento que abarcara no sólo los aspectos de la conducta instrumental dirigida a 
una meta sino también otros fenómenos que casaban mal con las teorías más 
tradicionales. Este modelo, como los enfoques de la respuesta múltiple que consi- 
deramos en la sección anterior, ofrece una concepción de la conducta animal que 
lo engloba todo. El reforzamiento se concibe como una forma de seleccionar res- 
puestas concretas del repertorio para que predominen en ciertos momentos y 
lugares. 

Un conjunto de observaciones contempladas en el modelo de Staddon/Sim- 
melhag lo componen la incumbencia y la deriva instintiva descritas en el capí- 
tulo 5. Como se recordará, esas observaciones indican que algunas respuestas son 
fáciles de reforzar, mientras que Otras se resisten, y compiten con los efectos del 
reforzamiento. Un segundo conjunto de observaciones incorporadas en el modelo 
de Staddon/Simmelhag se refiere a los fenómenos de la conducta adjuntiva des- 
critos anteriormente en este capítulo. Las explicaciones tradicionales de la con- 
ducta no han logrado aclarar esos efectos «extraños». Un tercer área de investiga- 
ción incorporada al modelo incluye el fenómeno de seguimiento del signo, 
descrito en el capítulo 3. Como se recordará, las palomas picotean una tecla que se 
ilumina inmediatamente antes de la entrega periódica de comida. Este fenómeno 
resultó problemático para las teorías del condicionamiento operante cuando se 
descubrió, porque hasta ese momento se creía que la conducta de picoteo sólo se 
podía fortalecer con procedimientos de condicionamiento operante. Por último, el 
modelo de Staddon/Simmelhag abarca también el experimento de superstición y 
las respuestas de ínterin y terminales. ¿Qué tienen en común todas esas áreas de 
investigación (las respuestas terminales y de ínterin, la conducta adjuntiva, el 
seguimiento del signo y la incumbencia)? En todas ellas intervienen respuestas a 
la presentación periódica de un reforzador, y muchas de ellas parecen estar 
determinadas biológicamente. El modelo de Staddon/Simmelbag describe la 
forma en que el reforzamiento intermitente reorganiza la conducta. 

El modelo de conducta que propusieron Staddon y Simmelhag recoge los prin- 
cipios de la teoría de la evolución de Darwin. Para Darwin, el surgimiento de las 
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características físicas de una especie era el resultado de una interrelación entre dos 
procesos, la variabilidad y la selección. Los individuos de una especie varían de 
forma natural en muchas de sus características (por ejemplo, peso, color de pelo y 
agilidad). La selección de las características que facilitan la trasmisión de los genes 
de una generación a la siguiente se realiza cuando los individuos que poseen 
características maladaptativas no son capaces de reproducirse o tienen una prole 
insana. 

Staddon y Simmelhag propusieron que en la conducta funcionan procesos de 
variación y selección análogos a los que sostenía Darwin. La conducta siempre 
varía. Los organismos, por naturaleza, no pasan mucho tiempo haciendo lo 
mismo. La conducta está cambiando siempre debido a la experiencia y el aprendi- 
zaje, a los cambios transitorios en el estado fisiológico, a las variaciones en el 
ambiente estimular, etcétera. Se supone que ciertos hechos o características del 
ambiente seleccionan de entre la variabilidad de la conducta ciertas respuestas que 
predominan en momentos concretos y en situaciones concretas. Uno de esos 
mecanismos de selección lo proporciona la presentación del reforzamiento, ya sea 
el reforzador contingente a la respuesta o independiente de la respuesta, De 
acuerdo con este punto de vista, el reforzamiento no «estampa» unas respuestas 
concretas. Sería mejor decir que limita la variabilidad de la conducta en momentos 
concretos, El sujeto no es víctima del emparejamiento accidental respuesta-refor- 
zador. Antes bien, el sujeto hace lo que suele hacer con el reforzador concreto; si 
el reforzador es grano, esperamos que las palomas den respuestas de picoteo. Si el 
reforzador se presenta en un programa periódico o intermitente, el sujeto simple- 
mente cambia su patrón de conducta para acomodarse a este programa. Cuando 
disminuye la probabilidad de aparición de un reforzador concreto, existe más 
variabilidad en la conducta, o bien las respuestas son seleccionadas por otros 
reforzadores. 

Según el modelo de Staddon/Simmelhag, la conducta supersticiosa y el segui- 
miento del signo son productos del mismo proceso. Se considera que ambos sur- 
gen como respuestas terminales. En el seguimiento del signo, la conducta se 
dirige a una luz que se enciende. Este análisis del reforzamiento como selección es 
aplicable también a la incumbencia y a los fenómenos de deriva instintiva. Se 
supone que cada reforzador da lugar a su propio conjunto de respuestas 
terminales. Por tanto, las respuestas y los reforzadores tienen una relación espe- 
cial entre sí. Es fácil que aparezca deriva instintiva cuando la respuesta requerida 
para ser reforzada no es una de las respuestas terminales propias de ese 
reforzador. 

El reforzamiento como selección de la respuesta también explica las caracte- 
rísticas del reforzamiento fuera del laboratorio. Consideremos, por ejemplo, el 
acto de arrancar un coche viejo una mañana de frío. Cada vez que introducimos la 
llave, indudablemente pasamos por varias respuestas, como sacar el aire, apretar 
el acelerador y accionar la llave, unas veces por períodos largos y otras por perío- 
dos cortos. Podemos dar además otras respuestas, como estornudar, ajustarnos 
mejor la bufanda al cuello, o lanzar una serie de improperios contra el trasto. 
Supongamos que al final el coche arranca. Es más probable que el arranque del 
coche refuerce las actividades realmente relacionadas con el encendido que las 
Otras respuestas que habíamos realizado antes de que el coche arrancara. 
Podríamos pensar en las respuestas relacionadas con el encendido como res- 
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puestas terminales para conseguir que el coche arranque. Todas las cosas que 
hagamos relacionadas con el encendido pueden no ser necesarias para lograr que 
arranque el coche. Juguetear con la llave en el encendido, por ejemplo, puede no 
ayudar en realidad. Sin embargo, es improbable que limitemos alguna vez nues- 
tras respuestas a aquellas acciones que son absolutamente necesarias para lograr 
que el coche arranque. Seguramente, repetiremos el patrón completo de respues- 
tas superfluas. Por el contrario, las respuestas no terminales, como ajustarse la 
bufanda, estornudar o lanzar improperios, no se reforzarán con el arranque del 
coche y no se presentarán necesariamente la próxima vez que intentemos arran- 
car el coche. 


COMENTARIOS FINALES 


Hemos presentado investigaciones y teorías sobre el reforzamiento que repre- 
sentan diversos puntos de vista. Ningún enfoque abarca todo. Cada enfoque parte 
de un conjunto particular de ideas acerca de lo que es un reforzador. Que conside- 
remos un reforzador como un estímulo o como una respuesta nos conduce, como 
hemos visto, por distintas direcciones. De hecho, en la mayoría de los casos un 
reforzador implica estímulos y respuestas. Determinar una característica común 
para todos los reforzadores es, por tanto, una tarea extremadamente compleja. 

La explicación de los mecanismos del reforzamiento descansa igualmente en 
un conjunto de suposiciones sobre la conducta instrumental. La respuesta instru- 
mental era considerada en un principio como una única conducta que aumenta su 
frecuencia con el reforzamiento. Para explicar este efecto de «estampación», los 
teóricos de la reducción del impulso sugirieron que se trataba de un mecanismo 
con base fisiológica. Sin embargo, conforme avanzaba la investigación se hizo más 
claro que las circunstancias que lo motivan no son tan simples. Los estados de 
impulso y los estímulos incentivadores interactúan de manera compleja, y no 
siempre completamente comprensible. Las teorías conductuales tienden a consi- 
derar la conducta instrumental como un producto de la reorganización total de la 
conducta en condiciones que no son óptimas. La idea de optimizar el valor con- 
ductual desempeña un papel central en esos modelos. Los sujetos vuelven a dis- 
tribuir su tiempo entre varias respuestas de forma que se haga máximo el valor 
de la conducta. La mayoría de los enfoques totalizadores pueden seguir en el 
futuro las direcciones propuestas por Staddon y Simmelhag. Este tipo de modelo 
puede reconciliar los enfoques biológicos y los conductuales. Parece que las con- 
ductas terminales tienen una capacidad de «estampación» que puede denominarse 
mejor de «selección». Esta selección, sin embargo, se produce dentro del marco de 
una redistribución del tiempo dedicado a las distintas respuestas, dentro de los 
límites de un procedimiento de condicionamiento instrumental. 
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Capítulo 8 

EL CONTROL POR EL ESTIMULO 

EN EL CONDICIONAMIENTO CLASICO 
E INSTRUMENTAL 


El capítulo 8 está dedicado a discutir cómo los procesos de condicionamiento 
clásico e instrumental pueden llegar a caer bajo el control de estímulos concretos 
que están presentes cuando se refuerza una respuesta o se empareja el EC con un 
El. Dado que se ha investigado mucho más extensamente el control por el estí- 
mulo en el condicionamiento instrumental que el control por el estímulo en el 
condicionamiento clásico, vamos a discutir con mucho más detalle el control por 
el estímulo en el condicionamiento instrumental. 

Empezamos definiendo el control por el estímulo y describiendo cómo puede 
medirse. Después describiremos con detalle los diversos factores importantes que 
determinan el control por el estímulo en la conducta instrumental y las interpre- 
taciones teóricas de los efectos de esos factores. El control por el estímulo en los 
procesos de condicionamiento clásico se describirá al final del capítulo. 


EL CONTROL POR EL ESTIMULO EN LA CONDUCTA INSTRUMENTAL 
Respuesta diferencial y discriminación del estímulo 
La generalización del estímulo 
Los gradientes de generalización del estímulo como medida del control por 
el estímulo 
Los mecanismos de generalización del estímulo 
La adquisición del control por el estímulo: la hipótesis del emparejamiento 
Los efectos de la capacidad sensorial y de la orientación sobre el control por el 
estímulo 
Los efectos de la experiencia sobre el control por el estímulo 
El entrenamiento de discriminación del estímulo 
Programas múltiples de reforzamiento 
La discriminación por el estímulo y los programas múltiples fuera del 
laboratorio 
El efecto del entrenamiento de discriminación sobre el control por el 
estímulo 
La gama de los postbles estímulos discriminativos. 
¿Qué se aprende en el entrenamiento de discriminación? 
La teoría de Spence del aprendizaje de discriminación 
El entrenamiento de discriminación sin error 


Los efectos del entrenamiento de discriminación intradimensional 
El fenómeno de desplazamiento. del máximo 
El aprendizaje de trasposición y relacional 
El aprendizaje relacional frente al estimular en la discriminación intradi- 
mensional 
Un enfoque de respuesta múltiple del entrenamiento de discriminación 
El control por los elementos de un estímulo compuesto 
La eficacia relativa de los elementos del estimulo como señales para el 
reforzamiento 
Los efectos del tipo de reforzamiento sobre el control por el estímulo 
Los efectos del tipo de respuesta instrumental sobre el control por el 
estímulo 
Los efectos de la facilidad relativa de condicionamiento de diversos estímulos 
EL CONTROL CONDICIONAL POR EL ESTIMULO EN EL CONDICIONA- 
MIENTO CLÁSICO 
EL CONTROL POR EL ESTIMULO FUERA DEL LABORATORIO 
El autocontrol 
Las interacciones sociales 
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EL CONTROL POR EL ESTIMULO EN LA CONDUCTA INSTRUMENTAL 


Hasta aquí nuestra discusión sobre la conducta instrumental ha hecho hinca- 
pié en la relación entre la respuesta instrumental y el reforzador. Como hemos 
visto en los capítulos 6 y 7, la relación respuesta-reforzador es un aspecto muy 
importante del condicionamiento instrumental. Sin embargo, las respuestas y los 
reforzadores no se presentan aislados del mundo. Es habitual que los animales 
experimenten estímulos concretos cuando dan la respuesta instrumental, tal como 
se ilustra en la figura 8.1. Considérese, por ejemplo, el reforzamiento con bolitas 
de comida de la presión de la palanca en las ratas. La respuesta de presión de la 
palanca (R) se realiza en presencia de muchos estímulos ambientales (EA), tales 
como el aspecto, el olor y los sonidos de la cámara experimental, y va seguida de 
la presentación del reforzador (ER+). Por tanto, resulta correcto considerar que 
la situación del condicionamiento instrumental contiene tres elementos funda- 
mentales: los estímulos ambientales EA, la respuesta instrumental R, y el refor- 
zador ER. Los estímulos EA, que están presentes cuando se refuerza la res- 
puesta instrumental, pueden desempeñar un papel muy, importante en el control 
de la conducta instrumental. El aspecto, el olor y los sonidos de la cámara expe- 
rimental (estímulos EA) proporcionan el contexto estimular para la conducta 
instrumental. Dado que la respuesta instrumental es recompensada en presencia 
de tales claves, éstas pueden llegar a controlar las apariciones de la respuesta. 

En muchas esferas de la vida fuera del laboratorio es evidente el control por el 
estímulo en la conducta instrumental. Para la mayoría de los estudiantes, por 
ejemplo, el estudiar está bajo un fuerte control de los estímulos relacionados con 
la escuela. Los estudiantes universitarios que se han quedado rezagados suelen 
tomar la firme resolución de estudiar mucho cuando vuelvan a casa en Navidad, 
Semana Santa o cualquier otra vacación. Sin embargo, en esos días no se suele 
conseguir trabajar mucho. El contexto estimular de las vacaciones es normal- 
mente muy diferente al de los estímulos experimentados en época de clases. Por 
tanto, los estímulos de las vacaciones no provocan una conducta de estudio eficaz. 
Las personas que se dedican a los negocios y viajan tienen con frecuencia un 
problema similar. Pueden encontrar que es difícil realizar mucho trabajo en los 
aviones porque el contexto estimular de un avión es demasiado diferente al de los 
estímulos de sus oficinas. 

El control de la conducta por el estimulo es un aspecto importante de los 
ajustes conductuales provocados por el ambiente. La supervivencia de los anima- 
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les en estado salvaje depende frecuentemente de su capacidad de dar respuestas 
que sean apropiadas a las circunstancias estimulares. Con los cambios estacionales 
en el suministro de comida, los animales, a veces, tienen que adoptar respuestas 
de abastecimiento diferentes para poder obtener comida. Dentro de la misma 
estación se requiere un tipo de conducta en presencia de los predadores o de los 
intrusos, pero en ausencia de un peligro cercano se refuerzan otro tipo de res- 
puestas. Con tiempo frío los animales pueden buscar confort yendo a zonas cal- 
deadas por el sol; en días lluviosos pueden buscar el confort yéndose a zonas 
cubiertas. Con el fin de obtener confort y evitar el dolor eficazmente, los animales 
siempre tienen que actuar de una manera que sea apropiada para sus circunstan- 
cias cambiantes. 

Adecuar la ejecución de las respuestas instrumentales a la situación estimular 
es tan importante que no hacerlo se considera anormal, Muchos actos instrumen- 
tales característicos de personas psicológicamente trastormadas son patológicos 
sólo en el sentido de que ocurren en situaciones imapropiadas. Desnudarse, por 
ejemplo, es una conducta instrumental aceptable en la intimidad de nuestro dor- 
mitorio. La misma conducta en una calle pública se considera sumamente anor- 
mal, Mirar fijamente el televisor se considera apropiado si el aparato está encen- 


. dido. Mirar fijamente un televisor sin imagen puede ser un síntoma de conducta 


patológica. Si respondemos de una forma cariñosa en presencia de nuestra esposa 
o de otros miembros de la familia, nuestra conducta tiene generalmente conse- 
cuencias positivas. La misma conducta dirigida hacta personas extrañas en una 
calle puede tener efectos muy distintos. Gritar en un partido de fútbol se refuerza 
con aprobación social. La misma conducta en una iglesia, en una clase o en un 
supermercado se desaprueba con vehemencia. 

Como ya advertimos antes, el reforzamiento de una respuesta instrumental 
ocurre habitualmente en presencia de estímulos concretos, y esos estímulos pue- 
den llegar a controlar la ejecución de la respuesta instrumental. ¿Cómo podemos 
nosotros decir que la conducta instrumental está bajo el control de esos estímu- 
los? ¿Cómo pueden los estímulos ejercer el control sobre la conducta instrumen- 
tal? ¿En qué sentido esos estímulos controlan la conducta, y qué aprenden los 
sujetos acerca de los estímulos? Cuestiomes como éstas ham sido extensamente 
discutidas e investigadas. Revisaremos a continuación algunos de los aspectos más 
interesantes de esta investigación. 


Respuesta diferencial y discriminación del estímulo 


El primer problema a resolvéase en una investigación sobre el control por el 
estímulo es cómo identificar y medir los casos en que aparece. ¿Cómo podemos 
decir que una respuesta instrumental está bajo el control de un estímulo? Consi- 
dérese, por ejemplo, una paloma en una caja de Skinner que picotea comida en un 
programa de reforzamiento de intervalo variable. Mientras la paloma permanece 
en la caja de Skinner está expuesta a una amplia variedad de estímulos, entre los 
que se encuentran el color y textura de las paredes de la cámara, las tuercas y 
cerrojos que sostienen la cámara, el olor de la cámara, y los sonidos de los venti- 
ladores. Además, supongamos que la tecla de respuesta circular de la caja se ilu- 
mine con un patrón consistente en un triángulo blanco sobre fondo rojo. La 
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paloma en esta situación está probablemente estimulada también por sensaciones 
internas provocadas por su grado de privación de comida y su bienestar físico 
general. ¿Cómo podemos determinar si esos estímulos físicos internos y externos 
controlan la conducta de picoteo de la tecla de la paloma? 

Reynolds (1961a) llevó a cabo un experimento utilizando estímulos similares 
a los que se describieron antes. En un programa de intervalo variable dos palomas 
fueron reforzadas al picotear una tecla de respuesta circular. El reforzamiento por 
picotear estaba disponible siempre que la tecla de respuesta se iluminara con un 
patrón visual consistente en un triángulo blanco sobre fondo rojo (véase figu- 
ra 8.2). El estímulo en relación con una tecla tenía, pues, dos componentes: el 
triángulo blanco y el fondo rojo. Reynolds se interesó en averiguar cuál de esos 
componentes del estímulo lograba un control sobre la conducta de picoteo. Por 
tanto, después de que las palomas aprendieran a responder de forma estable ante 
el triángulo sobre fondo rojo, Reynolds midió la cantidad de picoteo que tenía 
lugar cuando se presentaba solamente uno de los componentes del estímulo. En 
algunos ensayos de prueba, el triángulo blanco se proyectaba en la tecla de res- 
puesta sin el fondo rojo. En otros ensayos de prueba se proyectaba en la tecla de 
respuesta sólo el fondo de color rojo, sin el triángulo blanco, 

En la figura 8.2 se resumen los resultados. Una de las palomas dio muchos - 
más picoteos cuando la tecla de respuesta se iluminaba con la luz roja que cuando 
se iluminaba con el triángulo blanco. Este resultado muestra que la conducta de 
picoteo estaba mucho más controlada por el color rojo que por el triángulo 
blanco. Por el contrario, la otra paloma picoteaba mucho más cuando se proyec- 
taba el triángulo blanco en la tecla de respuesta que cuando la tecla se iluminaba 
con una luz roja. Así pues, en este sujeto la conducta de picoteo estaba mucho más 
controlada por el triángulo que por el estímulo del color. 

El experimento de Reynolds ilustra varias ideas importantes. En primer lugar, 
muestra la forma en que podemos determinar experimentalmente sí la conducta 
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Figura 8.2.—Sumario del procedimiento y resultados del experimento de Reynolds (1961a). Primero, 

dos palomas fueron reforzadas por picorear siempre que un estímulo compuesto, que consistía en un 

triángulo blanco sobre un fondo rojo, se proyectara sobre la tecla de respuesta. Después se registró la 

tasa de respuesta para cada sujeto cuando el triángulo blanco y el fondo rojo se presentaban por 
separado. 
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instrumental ha caído bajo el control de un estimulo concreto. El control por 
estímulo en la conducta instrumental queda demostrado sí la presencia de diferem- 
tes estímulos provoca respuestas diferenciales. Si un sujeto responde de una 
forma en presencia de un estímulo y de forma diferente en presencia de otro 
estímulo, podemos llegar a la conclusión de que su conducta está bajo el control 
de los estímulos implicados. Tales respuestas diferenciales se comprobaron en la 
conducta de las dos palomas con las que Reynolds realizó las pruebas. Ambos 
animales respondieron con más frecuencia en presencia de uno de los estímulos 
(el color rojo o el triángulo) que en presencia de otro. 

La respuesta diferencial a dos o más estímulos también indica que los sujetos 
están discriminando entre los estímulos —que están tratando cada estímulo como 
diferente de las otras claves—. Tal discriminación del estímulo no se produce 
siempre. Si las palomas hubieran ignorado las claves visuales proyectadas en la 
tecla de respuesta, o hubieran sido ciegas, habrían respondido de la misma 
manera al triángulo blanco que al color rojo de fondo. El hecho de que respondie- 
ran de forma diferente a los dos estímulos muestra que discriminaban entre las 
dos claves. Así pues, existe discriminación del estímulo siempre que los sujetos 
responden de forma diferente a los diferentes estímulos. La discriminación del 
estímulo y el control por el estímulo son dos formas de considerar el mismo 
fenómeno. No podemos tener una sin la otra. Si un sujeto no discrimina entre 
dos estímulos, su conducta no está bajo el control de esas claves. 

Otro aspecto interesante de los resultados era que la conducta de picoteo de 
cada animal quedó bajo el control de un componente diferente del estímulo. La 
conducta de un ave quedó bajo el control del color rojo, y la conducta de la otra 
ave bajo el control del triángulo. Los procedimientos utilizados en el experimento 
no dirigían a los animales a atender de forma especial a la luz roja o al triángulo. 
Por tanto, no resulta sorprendente que estímulos diferentes lleguen a controlar la 
conducta de picoteo de los sujetos. El experimento se podía comparar al hecho de 
mostrar a un grupo de escolares un cuadro famoso con un precioso marco dorada 
sin decirles en qué tenían que fijarse. Algunos niños pueden quedar cautivados 
por la belleza del marco, otros por la belleza del cuadro. A falta de procedimien- 
tos especiales del tipo que vamos a discutir más adelante, no podemos predecir 
cuál de los diversos estímulos que experimenta un organismo va a adquirir el 
control de la conducta instrumental. 

Aunque sólo uno de los componentes del estímulo provocaba mucho picoteo 
en cada una de las palomas, no podemos concluir a partir de esta información que 
el otro estímulo no tenga efecto alguno. Quizá la medida de alguna otra respuesta 
a los estímulos o algún otro aspecto del picoteo de la tecla, tal como la duración, 
habría suministrado pruebas de la existencia de control por ambos componentes 
del estímulo. Cuando se llevó a cabo el experimento, ofreció información sólo 
sobre el control por el estímulo de la tasa de picoteo de la tecla. Las conclusiones 
a las que podemos llegar a partir del estudio se limitan también a las característi- 
cas del estímulo que se variaban en las pruebas. El hecho de que una paloma 
respondiera con más frecuencia al triángulo blanco que al fondo rojo nos permite 
sólo llegar a la conclusión de que alguna propiedad o propiedades del triángulo 
eran importantes. No nos dice que la forma del triángulo era una característica 
esencial del estímulo. La conducta de picoteo bien podría haber estado controlada 
por el color o el brillo del triángulo. Se necesitan pruebas adicionales para identi- 
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ficar exactamente cuál de esas características del estímulo controlaba la conducta 
de picoteo. Esas consideraciones indican que las conclusiones a las que se puede 
llegar sobre el control por el estímulo quedan limitadas a las respuestas y los 
estímulos concretos utilizados en un procedimiento de prueba concreto. 


La generalización del estímulo 


En la discusión llevada a cabo hasta aqui hemos tratado los estímulos como si 
fueran entidades claramente identificables y distimguibles en el mundo. Sin 
embargo, identificar y distinguir distintos estímulos no es un asunto fácil. Los 
estímulos pueden definirse de todas las maneras. Á veces, objetos o hechos 
sumamente diferentes se consideran ejemplos del mismo estímulo porque todos 
ellos cumplen la misma función. Una rueda, por ejemplo, puede ser pequeña o 
grande, con radios o sin radios, de madera, de goma o de metal, con o sín neumá- 
tico. Por el contrario, en otros casos los estímulos se identifican y distinguen en 
términos de características físicas precisas, tales como la frecuencia de las ondas 
sonoras, o la longitud de onda de la luz. El color rojo, por ejemplo, se limita a una 
pequeña gama de longitud de onda de la luz. La luz que no cae dentro de esta 
gama restringida (naranja rojizo, por ejemplo) no se considera roja aun cuando se 
desvíe sólo ligeramente de la gama que sirve como criterio, 

Los psicólogos y fisiólogos hace tiempo que se interesan por la forma en que 
los organismos identifican y distinguen los diferentes estímulos. Vamos a plan- 
tear algunos aspectos del problema en el capítulo 12 cuando discurtamos sobre la 
formación de conceptos. El problema está también relacionado con el tema del 
control por el estímulo. Como veremos, intervienen numerosos factores en la 
identificación y diferenciación de los estímulos. Los análisis experimentales del 
problema han dependido principalmente del fenómeno de la generalización del 
estímulo, En un sentido, la generalización del estímulo es lo opuesto a la res- 
puesta diferencial, o discriminación del estímulo. Se dice que existe generalización 
del estímulo siempre que el sujeto no responde de forma diferencial a estímulos 
distintos. cuando se observa el misrno nivel de conducta en presencia de estímulos 
diferentes. 

El fenómeno de la generalización del estímulo fue observado por primera vez 
por Pavlov. Halló que después de que un estímulo concreto fuera condicionado, 
los sujetos también daban la respuesta condicionada a otros estímulos similares. 
Es decir, no respondían de forma diferencial a estímulos semejantes al estímulo 
condicionado original. También se ha investigado la generalización del estímulo 
en el condicionamiento instrumental. En un experimento que marcó un hito, 
Guttman y Kalish (1956) reforzaron primero a las palomas en un programa de 
intervalo variable por picotear una tecla de respuesta iluminada con una luz, cuya 
longitud de onda era de 580 nanómetros (de un color naranja amarillento). Des- 
pués del adiestramiento, los animales fueron expuestos a una variedad de colores 
distintos proyectados sobre la tecla de respuesta, y se registró la tasa de respuesta 
en presencia de cada color. En la figura 8.3 se resumen los resultados del experi- 
mento. La tasa de picoteo más alta se produjo en respuesta a la luz de 580 nm. 
Los sujetos también dieron un número sustancial de picoteos cuando se realizaron 
pruebas con las luces de longitud de onda de 570 nm y 590. nm: las respuestas se 
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Figura 8.3.—Gradiente de pene- 
ralización del estímulo en palo- 
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generalizaron a los estímulos de 570 nm y 590 nm. Sin embargo, conforme el 
color de los estímulos de prueba iba haciéndose diferente del color del estímulo 
del entrenamiento original, el número de respuestas fue disminuyendo progresi- 
vamente. Los resultados muestran un gradiente de respuestas que está en función 
del grado de semejanza de cada estímulo de prueba con el estímulo del entrena- 
miento original. Este tipo de resultado constituye un gradiente de generalización 
del estímulo. 


Los gradientes de generalización del estímulo como medida del control por el 
estímulo. Los gradientes de generalización del estímulo se utilizan a menudo 
para evaluar el control por el estímulo porque ofrecen una información sobre lo 
sensible que es la conducta del sujeto a las variaciones en un aspecto concreto del 
ambiente. Utilizando los gradientes de generalización del estímulo podemos 
determinar exactamente cuánto tiene que cambiarse el ambiente para producir un 
cambio en la conducta. Considérese, por ejemplo, el gradiente de la figura 8.3. Los 
sujetos respondían mucho más cuando se les presentaba el estímulo de 580 nm 
del entrenamiento original que cuando se iluminaba la tecla de respuesta con una 
luz cuya longitud de onda era de 520, 540, 620 y 640 nm. Así pues, las diferencias 
de color controlaban las diferencias en la respuesta. Sin embargo, este control no 
era muy preciso. Las respuestas al color de 580 nm se generalizaban a los estímu- 
los de 570 y 590 nm. La longitud de onda del estímulo del entrenamiento de 580 
nm se tenía que cambiar más de 10 nm para que se observara un descenso en el 
rendimiento. Este aspecto del gradiente de generalización del estímulo propor- 
ciona una información precisa sobre la cantidad de cambio que se tiene que pro- 
ducir en la lontitud de onda de luz para que las palomas consideren los colores 
como diferentes del estímulo original. 

El hecho de que se produzcan tasas de respuestas significativas en presencia 
de los estímulos entre 570 y 590 nm indica que el color de la tecla de respuesta no 
tenía que tener exactamente una longitud de onda de 580 nm para producir la 
respuesta de picoteo. ¿Cómo suponemos que hubieran respondido las palomas en 
el experimento si fueran daltónicas? Si los sujetos hubieran sido daltónicos, no 
hubieran podido distinguir las diferentes longitudes de onda de la luz. Por tanto, 
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Figura 8.4, —Gradiente hipotético de generalización del estimulo para palomas ciegas a los colores, 
adiestradas para picotear en presencia de uma luz coloreada de longitud de onda =580 nm, y después 
puestas a prueba en presencia de otros colores. 


hubieran respondido prácticamente del mismo modo, independientemente del 
color que se proyectara en la tecla de respuesta. La figura 8,4 presenta los resulta- 
dos hipotéticos de un experimento de esta clase. Si las palomas no respondían 
basándose en el color de la luz de la tecla, se hubieran producido tasas de respues- 
tas similares cuando se proyectaran en la tecla de respuesta los diferentes colores. 
Así, el gradiente de generalización del estímulo habría sido plano. 

La comparación de los resultados obtenidos por Guttman y Kalish y nuestro 
experimento hipotético con las palomas daltónicas indica que la pendiente del 
gradiente de generalización de un estímulo puede utilizarse como medida del 
punto hasta el cual la característica del esttmulo que estamos variando controla la 
conducta de los sujetos. Se obtiene un gradiente de generalización plano (figura 
8.4) si los sujetos responden del mismo modo a estímulos diferentes. Esta falta de 
respuesta diferencial muestra que la característica del estímulo que se hace variar 
en la prueba de generalización no controla la conducta instrumental. Por el con- 
trario, se obtiene un gradiente de generalización empinado sí los sujetos respon- 
den más a algunos de los estímulos de prueba que a otros. Esta respuesta diferen- 
cial es una prueba de que, de entre todos los estímulos de prueba, la conducta 
instrumental está bajo el control del estímulo cuyas características se varian. 
Podemos considerar como opuestas la generalización y la respuesta diferencial, Si 
se produce mucha generalización, se dan pocas respuestas diferenciales. Si las 
respuestas a los distintos estímulos son muy diferentes, se obtiene una generaliza- 
ción pequeña. 
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Los.mecanismos de generalización del estímulo. El fenómeno de la generali- 
zación del estímulo resulta llamativo porque muestra que las respuestas pueden 
darse ante estímulos que no se habían presentado ni emparejado con el reforza- 
miento durante el adiestramiento. ¿Por qué nuevos estímulos que nunca habían 
aparecido en el adiestramiento podían provocar la conducta condicionada? La 
primera persona que sugirió una respuesta a esta pregunta fue Pavlov. Pavlov 
observó efectos de la generalización del estimulo en sus experimentos de condi- 
cionamiento clásico. El advirtió, por ejemplo, que si en una parte de la piel se 
aplicaba un estímulo táctil condicionado con el El, los estímulos táctiles aplicados 
a las zonas adyacentes de la piel también provocaban la respuesta condicionada. 
Sin embargo, la fuerza de la respuesta condicionada era menor cuando los estímu- 
los de la prueba se aplicaban cada vez más alejadas de la localización original del 
EC. A partir de esas observaciones, Pavlow formuló un modelo de generalización 
del estímulo basado en la irradiación de la excitación. 

Pavlov suponía que cada estímulo produce excitación en una zona concreta del 
córtex, y que estímulos semejantes activan zonas fisicamente adyacentes. Propuso 
que cuando se presenta un EC y se empareja con el reforzamiento, se produce una 
excitación en el lugar del cerebro correspondiente al EC, y esta excitación irradia a 
lugares adyacentes del cerebro, de forma semejante a las ondas circulares que se 


forman en un lago en calma a partir del punto de contacto cuando se lanza un 


guijarro. Se suponía que la irradiación de la excitación era cada vez más débil 
conforme aumentaba la distancia al centro de excitación. Como recordarán, en el 
capitulo 4 se vio que, supuestamente, la excitación simultánea de los centros del 
EC y del El daba lugar a uma asociación entre los dos estímulos. Debido a “la 
irradiación de la excitación, siempre que se presentaba el EC, las zonas adyacentes 
también se activaban, y Pavlov afirmaba que esas zonas adyacentes del cerebro 
también se asocian con el centro del El. Así, a lo largo del condicionamiento, el El 
se asociaba no sólo con el EC, sino también con los estímulos semejantes al EC. 

El mecanismo neurológico que propuso Pavlov para explicar la generalización 
del estímulo fue acogido con escepticismo, pero la idea básica de que los efectos 
del entrenamiento se extienden a estímulos similares a las claves del entrena- 
miento fue adoptada por teóricos conductistas importantes, tales como Hull y 
Spence. Sin embargo, algunos psicólogos adujeron que incluso esta formulación 
era inaceptable. Considérese, por ejemplo, nuestro experimento hipotético de la 
generalización del estímulo en palomas daltónicas. Sugeríamos que esos animales 
responderían del mismo modo a estímulos de distintos colores. Mostrarían una 
generalización del estimulo perfecta. Tal resultado podría no explicarse en térmi- 
nos de la propagación del efecto de excitación, ya que en los animales daltónicos 
la presentación de un color concreto durante el entrenamiento no produce, posi- 
blermente, una excitación de la zona del cerebro correspondiente a ese color. Una 
explicación mucho más razonable de nuestros resultados con los sujetos daltóni- 
cos es que respondían de forma similar a todos los colores porque no podían 
distinguir diferencias entre ellos. Este tipo de explicación alternativa de la genera- 
lización del estimulo fue propuesto por Lashley y Wade (1946) en un fuerte 
ataque a la hipótesis de la irradiación de la excitación. Lashley y Wade sugirieron 
que la generalización de una respuesta condicionada de un estímulo a otro refleja 
la incapacidad del sujeto para discriminar diferencias entre los estímulos. Sugirie- 
ron que los animales tienen que aprender a tratar los estímulos como similares o 
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diferentes ente sí. Por tanto, frente a Pavlov, ellos consideraban que la forma de 
un gradiente de generalización de un estímulo venía determinada totalmente por 
las experiencias sensoriales anteriores del sujeto más que por las propiedades 
físicas de los estímulos utilizados. Las investigaciones experimentales no han con- 
firmado todas las ideas de Lashley y Wade. Como veremos, sin embargo, existen 
pruebas suficientes de que la forma de los gradientes de generalización de un 
estímulo depende en gran parte de las experiencias anteriores del sujeto con los 
estímulos implicados. (Véase una revisión reciente de la teoría y de la metodolo- 
gia basada en los gradientes de generalización del estímulo en Honig y Urcuioli, 


1981.) 


La adquisición del control por el estímulo: 
la hipótesis del emparejamiento 


Una vez definido lo que constituye el control por el estímulo y cómo puede 
medirse, podemos empezar a discutir la forma en que los estímulos llegan a con- 
trolar la conducta. El primer análisis del contro! por el estímulo se basaba en lo 
que podríamos llamar la hipótesis del emparejamiento. De acuerdo con esta idea 
la mera presencia de un estímulo cuando se refuerza una respuésta es suficiente 
para que el estímulo adquiera el contro! de la conducta. Ya hemos advertido que 
la situación de condicionamiento instrumental está compuesta de tres elementos 
los estímulos ambientales EA en presencia de los cuales se lleva a cabo el condi- 
cionamiento instrumental, la respuesta instrumental R, y la consecuencia de la 
respuesta, o reforzador, ER + (véase figura 8,1). La hipótesis del emparejamiento 
sugiere que los estímulos EA adquieren el control de la ejecución de la respuesta 
instrumental simplemente porque esos estímulos ambientales están presentes 
cuando se refuerza la respuesta. Esta idea relativamente simple ha tenido una 
importante y duradera influencia en las concepciones acerca de los mecanismos de 
control por el estímulo. En los primeros análisis de la conducta instrumental 
como los de Thorndike y Guthrie, se consideró que los estímulos ambientales ue 
están presentes cuando se refuerza una respuesta desempeñaban un papel mu 
importante en el control de la conducta. Se suponía que los estímulos ambientales 
se condicionaban para provocar la respuesta instrumental de forma muy parecida 
a como el estímulo clásicamente condicionado provoca una respuesta condicio- 
nada. Por ejemplo, Thorndike, en su ley del efecto, afirmaba que si una respuesta 
en presencia de un estímulo va seguida de un hecho satisfactorio. la asociación 
entre el estímulo y la respuesta se fortalece (véase capítulo 5). Debido a esta 
asociación, la respuesta instrumental llega a estar controlada por el estímulo. El 
ÚNICO requisito para la formación de la asociación estímulo-respuesta era la conti- 
giúsdad del estímulo con la respuesta reforzada. Así pues, se pensó que los estímu- 
los adquirían un control sobre la conducta simplemente por el hecho de estar 
presentes cuando se reforzaba la conducta. 

Á pesar de su aparente simplicidad, la hipótesis del emparejamiento ha 
logrado predecir con éxito que los estímulos aparentemente incidentales que se 
encuentran presentes durante el condicionamiento instrumental pueden adquirir 
un control sobre la ejecución de la respuesta instrumental. Riccio, Urda y Thomas. 
(1966), por ejemplo, condicionaron a unas palomas para que picotearan una tecla 
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iluminada en un programa de intervalo variable. Durante el adiestramiento de la 
respuesta de picoteo de la tecla no se realizó un esfuerzo especial para que los 
sujetos prestaran atención a la orientación del suelo de la cámara experimental. 
Después del entrenamiento, los sujetos pasaron una prueba de generalización del 
estímulo en la que el suelo se inclinó en distintos grados respecto a su posición 
original. Confirmando la hipótesis del emparejamiento, la prueba de generaliza- 
ción del estímulo reveló que la orientación del suelo había adquirido un control 
sobre la respuesta instrumental. Las tasas más altas de picoteo se produjeron 
cuando. el suelo tenía la misma orientación que durante el entrenamiento; los 
diferentes grados de inclinación a partir del nivel del entrenamiento producían 
descensos correlativos en la conducta instrumental. 

Aunque la hipótesis del emparejamiento ha logrado éxitos considerables, no 
siempre ha dominado el pensamiento sobre la adquisición del contro! por el estí- 
mulo. El descubrimiento de otros muchos factores también importantes para la 
adquisición del contro! por el estímulo que limitan la aplicación de la hipótesis del 
emparejamiento, ha provocado la pérdida de interés por esta hipótesis. Á conti- 
nuación discutiremos esos procesos alternativos. Sin embargo, encontraremos de 
nuevo hallazgos coherentes con la hipótesis del emparejamiento cuando al final 
del capítulo consideremos las investigaciones recientes sobre el papel de los estí- 
mulos contextuales en el control de la conducta aprendida. 


Los efectos de la capacidad sensorial y de la orientación 
sobre el control por el estímulo 


La capacidad sensorial del organismo y la orientación son dos factores que 
limitan de forma importante los aspectos del ambiente que pueden adquirir un 
control sobre la conducta. Esos dos factores ayudan a determinar la manera en 
que el ambiente aparece ante el organismo. La presentación de un hecho ambien- 
tal con ciertas características de interés para nosotros no garantiza que el sujeto 
responda a esas mismas características. Debemos siempre considerar la perspec- 
tiva del sujeto en un análisis del control! del estímulo. No podernos advertir sim- 
plemente ciertas características de los hechos que presentamos a un organismo, y 
suponer que el sujeto percibe los estímulos de la misma forma que lo hacemos 
nosotros. Ántes bien, tenemos que dejar que el sujeto nos diga a través de su 
conducta qué percibe de los hechos que le presentamos. 

Uno de los determinantes más obvios de la forma en que percibe el sujeto su 
ambiente lo constituye la capacidad sensorial del organismo. La conducta de un 
sujeto puede estar bajo el control de un estímulo concreto sólo si el organismo es 
sensible a ese estímulo. Los hechos que se sitúan fuera de la gama de lo que el 
sujeto puede detectar con sus Órganos sensoriales no existen para ese sujeto, a 
menos que se amplifiquen o se transformen en algo que el organismo pueda 
detectar. Las personas no pueden, por ejemplo, detectar sonidos cuyo tono esté 
por encima de 20.000 ciclos por segundo. Esos sonidos se llaman «ultrasónicos» 
porque se encuentran fuera de la gama del oído humano. Dado que los ultrasoni- 
dos resultan inaudibles para las personas, esos sonidos no pueden llegar a contro- 
lar la conducta humana. Otras especies, sin embargo, son capaces de oír ultrasoni- 
dos. Los perros, por ejemplo, pueden oír silbidos fuera de la gama del oído 
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humano y, por tanto, pueden ser adiestrados para responder a tales sonidos. 

Cuando el sujeto se pone en contacto con el estímulo se establecen también 
límites sobre los estímulos que pueden llegar a controlar la conducta. Considérese, 
por ejemplo, una cuna de un niño, Los padres con frecuencia colocan móviles y 
otros objetos decorativos por encima y alrededor de la cuna, para proporcionar al 
niño estímulos interesantes a los que mirar. La cuna que se muestra en la figura 
8.5 está decorada con un móvil. El móvil consiste en varias figuras finas de ani- 
males de ganchillo sobre cartón (entre las que se incluyen un león, una jirafa y 
una foca). ¿Qué aspectos de este estímulo complejo pueden llegar a controlar la 
conducta del bebé? Para responder a esta pregunta tenemos que considerar pri- 
mero qué es lo que ve el niño en el móvil más que cómo es el móvil para el 
adulto. En la posición estratégica del niño debajo del móvil sólo son visibles los 
bordes inferiores de las figuras. Las formas de los animales y las decoraciones de 
la superficie no pueden verse muy bien desde abajo. Por tanto, no es probable que 
esas otras características logren un control de la conducta de mirar del niño. Estas 
consideraciones ilustran que la orientación del sujeto respecto a las diversas carac- 
terÍsticas de su ambiente influye enormemente en qué estímulos adquirirán el 
control de su conducta. (Para más información sobre los resultados de investiga- 
ciones que ¡lustren la importancia de la orientación en la adquisición del control 
por el estímulo, véase, por ejemplo, Gillette, Martin y Bellingham, 1980.) 


Figara 8.5.—Un niño mirando 
un móvil, 
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Los efectos de la experiencia sobre el control por el estímulo 


Uno de los determinantes más importantes del control por el estímulo es la 
experiencia pasada del sujeto. Estimulados en parte por las propuestas de Lashley 
y Wade, los investigadores se han interesado mucho más por esta variable. Lash- 
ley y Wade sostenían que los animales van aprendiendo a distinguir semejanzas y 
diferencias entre los estímulos a medida que experimentan las variaciones natura- 
les de los estímulos. Se suponía, por ejemplo, que la exposición a distintos colores 
a lo largo de nuestras actividades normales producía las discriminaciones entre los 
colores. Si esto es así, entonces los animales expuestos a muy pocos colores desde 
el nacimiento no deberian de responder de forma diferencial cuando tuvieran 
experiencia de otros colores en su vida. Se han llevado a cabo varias pruebas sobre 
esta predicción. Peterson (1962), por ejemplo, crió patos en una jaula iluminada 
con una luz de sodio que hacía que hubiera muy poca diferencia entre los distintos 
colores. Los patos fueron condicionados entonces a picotear una tecla de un color 
concreto. Un grupo de control de animales que habían sido criados con luz nor- 
mal y expuestos a varios colores de la forma normal recibieron el mismo tipo de 
entrenamiento de picoteo de la tecla. A continuación realizó con ambos grupos 
pruebas en que se presentaban varios colores para comprobar la generalización 
del estímulo. Corroborando la predicción de Lashley y Wade, los patos criados con 
luz de sodio monocromática presentaron un gradiente de generalización plano. 
Por el contrario, los patos criados normalmente presentaron un gradiente acam- 
panado, lo que indica una respuesta diferencial a los diversos colores. Podemos 
concluir a partir de la diferencia en los gradientes de generalización que el color 
sólo controlaba la conducta de picoteo de los patos criados normalmente. 

Los hallazgos de Peterson indican, claramente, que la experiencia previa es 
importante para el control por el estímulo. Sin embargo, los resultados no se han 
repetido en muchas ocasiones. Por otra parte, no está claro qué aspectos de la 
experiencia experimental del grupo anormal eran responsables de los resultados. 
Que los animales crezcan sin exponerse a colores distintos puede alterar el des- 
arrollo del sistema visual, El adecuado desarrollo de las diversas partes del ojo y 
del cerebro que intervienen en la visión del color puede que requiera la exposición 
a colores diferentes en la edad temprana. | 


El entrenamiento de discriminación del estímulo. Una razón posible de que 
los patos criados sin una exposición mormal a los diversos colores a veces no 
respondan de forma diferencial a los colores es que no han tenido diferentes tipos 
de experiencias con los estímulos del color. Por ejemplo, las claves del color no 
les permitían distinguir diferentes objetos de su medio. Esta posibilidad puede 
comprobarse exponiendo a los sujetos a una situación en la que las diferencias de 
color signifiquen algo importante. Para realizar esto en experimentos de labora- 
torio se utilizan procedimientos de discriminación del estimulo. En un proce- 
dimiento de discriminación del estímulo, el sujeto se expone, al menos, á 
estímulos diferentes —digamos a una luz roja y a Otra v —. Sin embargo, el. 
reforzamiento por realizar la conducta instrumental sólo está disponible.en.pre- 
sencia de uno de los colores. Por ejemplo, el: ¡emplo, el sujeto podría ser reforzado.por-las 


respuestas en los ensayos en que la luz roja está encendida pero no cuando está 
encendida la luz verde. En este procedimiento, que se muestra en el diagrama de 
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la figura 8.6, la luz roja señala la disponibilidad de reforzamiento por la respuesta. 
La luz verde señala que la respuesta . El estimulo que señala 


la disponibilidad del reforzamiento se llama, a menudo, E+ o ED (se pronuncia 
«e, de»). Por el contrario, el estímulo que señala la falta de. reforzamiento se. 
llama E— o EA (se pronuncia «e, delta»). 

Con una exposición suficiente al procedimiento de discriminación, los. sujetas 
llegan a responder siempre que se presenta el E+ y dejan de responder siempre 
que se presenta el E-—7 La adquisición de este patrón de respuestas se ilustra en 
el gráfico de la figura 8.6. En un principio, los sujetos respondea de forma simular. 
en presencia del E-+ y del E —. Sin embargo, conforme avanza el entrenamiento, 
las respuestas en presencia del E + se mantienen, mientras que las respuestas en. 
presencia del E.— disminuyen..El hecho de que los sujetos respondan mucho más 
al E+ que al E— indica la respuesta diferencial a los estímulos E+ y E—. Así 
pues, con los procedimientos de discriminación del estímulo se logra que ejerzan. 

_ el control aquellos estímulos que señalan cuándo está y cúando no está disponible 
el reforzamiento. Una vez que los E + y E— han adquirido un control sobre la 
conducta del sujeto, se llaman escimulos discriminativos. El E + es un estímulo 
discriminarivo para ejecutar la respuesta instrumental, y el E— es un estímulo 
discriminativo para_no ejecutar Ja respuesta 

El procedimiento que se muestra en el diagrama de la figura 8.6 es el proce- 
dimiento estándar para el entrenamiento de discriminación del estímulo en el 
condicionamiento instrumental. Puede también establecerse una discriminación 
del estímulo utilizando procedimientos de condicionamiento clásico. En este caso, 
un EC (el EC +) se empareja con el estímulo incondicionado, y otro EC (el EC—) 
se presenta sin el El. Al emparejar repetidamente el EC con el El y presentar 














APARTADO 8.1. La percepción de fotografías 


Las forografías son uno de los materiales educativos que se utilizan con más frecuencia. 
A través de las fotos los profesores pueden ampliar sumamente la experiencia de los niños 
con distintos elementos de su ambiente, así como del mundo en general. Las focografías se 
usan a menudo con niños pequeños y con sujetos retrasados para facilitar la adquisición del 
lenguaje. En todos estos casos, se supone que el niño puede percibir que la foro representa 
algo del mundo real. Un estudio de Lois Dixon (1981) cuestiona la validez de tan simple 
suposición cuando se trabaja con sujeros profundamente retardados. Lois «trabajó con ado- 
lescentes profundamente retardados usando un problema de discriminación llamado 
«ajuste a la muestra», Al niño se le mostraba primero un objeto (la muestra), como, por 
ejemplo, un plátano. Á continuación se le mostraban dos objetos más (objetos de elección), 
cada uno de ellos en una caja distinta Uno de los objetos de elección era igual que la 
muestra y el otro era diferente. El niño renía que poner el objeto de muestra en la caja en 
que el objeto de elección fuera igual a él. Los emparejamientos correctos se reforzaban. 
(Para una discusión más detallada sobre los procedímientos de ajuste a la muestra, véase 
capítulo 11.) Más tarde, las muestras y los objetos eran fotografías, y finalmente se utiliza- 
ron a la vez fotografías y objetos. La prueba consistía en ver si los niños sabían ernparejar 
la fotografía de un objeto con el objeto mismo. Sólo uno de los cinco niños que realizaron 
la prueba fue capaz de hacerlo. Trabajos posteriores sugirieron que los fallos eran debidos 
en parte a las propiedades físicas de las fotografías. En concreto, los fallos parecian estar . 
relacionados con el hecho de que las fotografías fueran planas y rectangulares. Cuando se 
recortaba la imagen, el rendimiento mejoraba. Parece ser que la forma era una caracterís- 
tica más sobresaliente para esos niños que la semejanza entre una imagen fotográfica y un 
objeto físico. 
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sólo el EC—, los sujetos aprenden gradualmente a dar la respuesta condicionada 
ante el EC+ y a inhibir la RC cuando se presenta el EC—-. (En el capítulo 3 ya se 
discutió este procedimiento; véase la figura 3.9.) Los procedimientos instrumenta- 
les de discriminación por el estímulo son únicamente diferentes de los procedi- 
mientos de condicionamiento clásico en que el sujeto tiene que ejecutar la res- 
puesta instrumental en presencia del E + para recibir reforzamiento. Así pues, el 
E + no señala que se vaya a suministrar el reforzamiento automáticamente. Más 
bien, el E+ indica que la ejecución de la respuesta instrumental va a ser 
reforzada. 


Programas múltiples de reforzamiento. El procedimiento de discriminación 
por el estímulo que se muestra en la figura 8.6 es simplemente una de las formas 
de establecer la respuesta diferencial. Se pueden desarrollar respuestas diferencia- 
les a dos (o más) estímulos siempre que cada estímulo señale un programa dife- 
rente de reforzamiento para la respuesta instrumental. Por ejemplo, podríamos 
reforzar las respuestas en presencia de una luz roja com_un programa de razón 
variable 5 (RV 5), y reforzar las respuestas en presencia de una luz verde con un 
programa de intervalo fijo de 1 mia (IF 1 min). Tal procedimiento se muestra en 
el diagrama de la figura 8.7. Como podemos recordar, en el capítulo 6 se decía que 
un programa de razón variable mantiene una rasa estable de respuestas. Por el 
contrario, en un programa de intervalo fijo los sujetos realizan una pausa después ' 
de cada reforzamiento y posteriormente van incrementando de forma gradual su 


tasa de respuestas hasta el reforzamiento siguiente (produciendo un patrón festo- 


E+ (rojo) , E — (verde) 
R — ERFH/ Ep R — No ERE 


Respuestas acumulativas 


A A 





Tiempo 


Figura 8.6.—Procedimiento y resultados hipotéticos (presentados en forma de registro acumulativo) 

de un entrenamiento de discriminación del estímulo. La respuesta es reforzada en presencia del E + 

(una luz roja) y no es reforzada en presencia de E— (una luz verde). Gradualmente se desarrolla una 

respuesta diferencial a los dos escimulos. (Las marcas verticales en el registro acumulativo indican 
reforzamientos.) 
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Rojo Verde 


Crv 5- ER+] Lor l-min > R —ER+] 


Respuestas acumulativas 


Rojo | Verde Rojo Verde Rojo | Verde Rojo Verde Rojo 





Tiempo 


Figrra 8.7 —Procedimiento y resultados hipotéticos (presentados en forma de registro acumulativo) 

de un programa múltiple de reforzamiento. La respuesta es reforzada con un programa de razón 

variable 5 en presencia de una luz roja, y es reforzada con un programa de intervalo fijo 1 minuto en 

presencia de una luz verde. La tasa constante de respuesta, característica de un programa RV 5, se 

presenta cuando hay una luz roja; la tasa de respuesta festoneada, característica de un programa RE 1 

minuto, aparece con la luz verde. (Las marcas verticales en el registro acumulativo indican reforza- 
mientos.) 


neado). En un programa múltiple, gradualmente los sujeros llegan a realizar el 
patrón de la conducta instrumental apropiado en presencia de cada estímulo. 
Siempre que la luz roja está encendida se produce una tasa estable de respuestas 
que se corresponde con el programa de razón variable; siempre que se enciende la 
luz verde aparece un patrón festoneado que se corresponde con el programa de 
intervalo fijo. En la figura 8.7 se ilustra este resultado. Los diferentes patrones de 
respuesta que tienen lugar en presencia de las luces roja y verde jndican que esos.... 
estímulos controlan la respuesta diferencial. Para llegar a la conclusión de que 
existe respuesta diferencial a los estímulos mo tenemos necesariamente que ver 
respuestas ante un estímulo y ausencia de respuestas a un estímulo diferente. 
Un procedimiento del tipo que se muestra en la figura 8.7 se llama programa 


múltiple de reforzamiento. En un programa múltiple, diferentes programas de 
teforzamiento tienen Tapar de. forma consecutiva en presencia de estímulos dife- 
rentes, Los procedimientos de discriminación del estímulo son un tipo especial de 
programa múltiple en los que el programa de reforzamiento que se administra en 
presencia de uno de los estímulos es la extinción. El resultado general con pro- 
gramas múltiples consiste en que el patrón de respuestas que se da en presencia 
de un estímulo concreto se corresponde con el programa de reforzamiento que se 
ha asignado a ese estímulo. Los programas múltiples muestran que los patrones 
de respuesta producidos por distintos programas de reforzamiento pueden quedar 
bajo el control de los estímulos que están presentes cuando tiene lugar cada pro- 
grama. 
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La discriminación por el estímulo y los programas múltiples fuera del labora- 
torso. Casi todos los programas de reforzamiento que existen fuera del laborato- 
rio tienen lugar sólo en presencia de estímulos concretos. Jugar a algo produce 
reforzamiento sólo en presencia de compañeros divertidos o estimulantes. Tener 
prisa se refuerza en presencia de estímulos que indican que llegamos tarde y no se 
refuerza en presencia de estímulos que nos indican que no Hegamos tarde. El. 
conducir deprisa se refuerza en una autopista, pero no en una calle de ciudad. Las 
discusiones en voz alta y bulliciosas con amigos se refuerzan en las fiestas de los 
sábados por la noche. El mismo tipo de conducta no se refuerza durante el ser- 
món de la iglesia. Comer con los dedos se refuerza en una comida campestre, pero 
no en un restaurante elegante. Vestirnos con nuestras mejores galas está refor- 
zado cuando vamos a un baile de gala, pero no cuando nos disponemos a pintar el 
garaje. Nuestras actividades diarias consisten habitualmente en pasar de una 
situación a otra (a la cocina para desayunar, al autobús, a la oficina, a la oficina de 
otro, a la tienda, etcétera), y en cada situación se suministra reforzamiento con 
programas diferentes. 


El efecto del entrenamiento de discriminación sobre el control por el es- 


témulo, Como ya hemos advertido, el entrenamiento de discriminación coloca la 
respuesta instrumental bajo el control de los estímulos utilizados. Llegamos a esta 
conclusión porque el entrenamiento de discriminación produce una respuesta 
diferencial a los estímulos E + y E —. ¿Qué grado de precisión posee el control 
que el E + adquiere sobre la conducta instrumental, y qué factores determinan la 
precisión que alcanza el control por el estímulo? Para responder a tales cuestiones 
no basta con advertir la respuesta diferencial a E + frente a E —. Tenemos tam- 
bién que averiguar lo empinado que resulta el gradiente de generalización cuando 
los sujetos realizan pruebas con estímulos en los que se ha variado sistemática- 
mente alguna propiedad del estímulo que actuaba como E +. Además, debemos 
averiguar qué aspecto del procedimiento del entrenamiento de discriminación es 
el responsable del tipo de gradiente de generalización obtenido. Estos problemas 
se plantearon por primera vez en los experimentos de Jenkins y Harrison sobre 
condicionamiento clásico (1960, 1962). 

Jenkins y Harrison investigaron la forma en que los estímulos auditivos de 
diferentes frecuencias (tonalidades) llegan a controlar la conducta de picoteo de 
las palomas reforzadas con comida. Midieron la forma en que las palomas res- 
pondían a sonidos de diferentes frecuencias después de tres tipos de procedimien- 
tos de adiestramiento. Un grupo de sujetos fue reforzado durante el adiestra- 
miento por picotear en presencia de un tono de 1.000 ciclos por segundo (1 ciclo 
por seg = 1 herzio) y no recibió reforzamiento cuando no estaba presente el 
sonido. Por tanto, para esos sujetos el tono de 1.000 Hz hacía de E + y la ausen- 
cia de sonidos hacía de E —. Un segundo grupo de palomas también recibió 
entrenamiento de discriminación. El tono de 1.000 Hz hacía de nuevo de E +. Sin 
embargo, para el segundo grupo el E — era un sonido de 950 Hz. Así pues, esas 
palomas eran reforzadas por picotear siempre que se presentaba el tono de 1.000 
Hz y no reforzadas cuando se presentaba el sonido de 950 Hz. El tercer grupo de 
palomas sirvió de grupo de control y no recibió entrenamiento de discriminación. 
Con estos animales el tono de 1.000 Hz estaba continuamente activado, y po- 
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ereminación aumenta el control de la conducta imstrumental por el estímulo. Por 
otra parte es más probable que una dimensión concreta del estímulo tal cómo la 
frecuencia tonal adquiera control sobre la respuesta, si los estímulos E + y E — 


50 


A 


*—— E+=Hz; E—=nmo tono 


E-+=t0m0 de 1.000 Hz; E—=950 Hz utilizados en el procedimiento de discriminación difieren precisamente en esa 
Sin adiestramiento de discriminación propiedad del estímulo. El contro! más preciso a través de la frecuencia tonal se 
77 (control) 


A a Eo 


observó en los sujetos que habían recibido entrenamiento de discriminación en el. 


de uña frecuencia (1.000 Hz) y el E — un sonido de. 

otra frecuencia (950 Hz). El entrenamiento de discriminación no producía un 
control tan fuerte por la escala si el E + era un sonido de 1.000. Hz y. el BE. era —. 
la ausencia de sonidos. En este caso, los sujetos aprendían una discriminación 
entre la presencia y la ausencia del sonido de 1.000 Hz y podían haber estado 
respondiendo basándose en la intensidad o el timbre del sonido además de en su 
frecuencia. 

: Algunos investigadores han utilizado resultados como los obtenidos por Jen- 

; kios y Harrison para afirmar que los estímulos llegan 2 controlar la conducta 
instrumental sólo si los sujetos experimentan un reforzamiento diferencial en 
conexión con los estímulos (por ejemplo, Terrace, 1966b). De acuerdo con esta 
hipótesis, si los sujetos no se exponen a programas de reforzamiento diferentes 
en presencia de estímulos diferentes, estos estímulos no adquieren un control 
sobre su conducta. 

Al analizar por qué un tipo concreto de estímulo ha llegado a controlar la 
conducta instrumental es importante considerar no sólo qué reforzamiento dife- 
rencial se suministra durante el experimento, sino también qué reforzamiento 
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a 300 450 670 1000 1500 2250 3500 diferencial puede darse fuera del contexto experimental. Thomas, Mariner y 
Frecuencia absolura (Hz) Sherry (1969), por ejemplo, reprodujeron el grupo de control de la prueba de 
Jenkins y Harrison y confirmaron que el gradiente de generalización para las 
Figura 8.8.—Gradientes de generalización de respuesta ante tonos de distinta frecuencia después de frecuencias tonales es plano cuando los sujetos no reciben un entrenamiento de 
diferentes tipos de adiestramiento. Un grupo recibió un entrenamiento de discriminación en el cual un discriminación. También realizaron pruebas con un segundo grupo de palomas 


tono de 1.000 Hz sirvió como E+, y la ausencia de tonos como E—. Otro grupo recibió un entrena- 

miento en el cual un rono de 1.000 Hz sirvió como E+, y un tono de 950 Hz como E—. El grupo de 

control no recibió un entrenamiento de discriminación antes de la prueba de generalización. (Según | 
Jenkins y Harrison, 1960-1962.) 


que habían pasado por una experiencia con un tono de 1.000 Hz en la jaula que 
les servía de hogar. En esta jaula, cada vez que se servía la comida, sonaba un 
tono de 1.000 Hz. El entrenamiento de picoteo de la tecla en la cámara experi- 
mental se realizó del mismo modo con esos animales que con los del grupo de 
control. Las pruebas de generalización del estímulo en las que se utilizaban soni- 


dían recibir reforzamiento siempre que picotearan en la cámara experimental. dos de varias frecuencias dieron como resultado un gradiente de generalización 
Tras los procedimientos de adiestramiento descritos arriba, cada paloma empinado en el grupo que había experimentado el tono emparejado con la admni- 
realizó pruebas de picoteo en presencia de tonos de distintas frecuencias para ver nistración de comida. Los efectos del entrenamiento diferencial llevado a cabo en 
hasta qué punto el picoteo de cada grupo estaba controlado por la frecuencia de la jaula hogar con un tono de 1.000 Hz se transferían a la cámara experimental y 
los sonidos. La figura 8.8 muestra los gradientes de generalización obtenidos en el | daban lugar a un mayor control del picoteo mediante la frecuencia de los tonos. 
experimento. El grupo de control, que no había recibido entrenamiento de dis- Resulta intuitivamente atractiva la idea de que el reforzamiento diferencial es 
criminación, respondía casi igual en presencia de todos los estímulos de la prueba: necesario para el desarrollo del control por el estímulo. Sin embargo, la hipótesis 
la frecuencia de los tonos no controlaba la conducta. Los otros dos procedimientos resulta casi imposible de refutar con la experimentación. Siempre que hallamos 
de entrenamiento provocaban un control sobre la conducta de picoteo por parte | un caso en que se produce un control por el estímulo en ausencia de un entrena- 
de la frecuencia de los tonos. El control por el estímulo más intenso (el gradiente ¡ miento diferencial explícito, podemos postular una posible fuente de reforza- 
de generalización más empinado) se observó en animales que habían sido refor- miento diferencial inadvertido que podría haberse dado fuera de la situación 
zados por responder en presencia del tono de 1.000 Hz (E +) y no reforzados por experimental. El'mero hecho, por ejemplo, de que para obtener la comida en una 
responder al tono de 950 Hz (E —). Los sujetos que recibieron entrenamiento de | caja de Skinner se requieran respuestas diferentes que para obtenerla en una jaula 
discriminación entre el tono de 1.000 Hz (E +) y la ausencia de sonidos (E —) ¡ hogar, puede ser suficiente para producir control por los estímulos propios de la 
mostraron un grado intermedio de control por el estímulo a través de la frecuen- ¡ caja de Skinner. 
cia tonal. — 


El experimento de Jenkins y Harrison muestra que el entrenamiznto de des... 
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La gama de los posibles estímulos discreminativos. Los procedimientos de 
discriminación pueden utilizarse para colocar la conducta instrumental del sujeto 
bajo el control de una amplia variedad de estímulos. Se ha logrado llevar a cabo 
un entrenamiento de discriminación con todo tipo de estímulos discriminativos. 
Por ejemplo, Eslinger y Ludvigson (1980) utilizaron los olores que dejaban las 
ratas recompensadas frente a las no recompensadas como estímulos discriminati- 
vos para otras ratas. Spetrch y Wilkie (1981) utilizaron las presentaciones de 
comida de 10 segundos frente a las presentaciones de 5 segundos como estímulos 
discriminativos con palomas. Capaldi, Nawrocki y Verry (1984) demostraron que 
las claves internas por haber sido o no haber sido recompensados pueden hacer 
de estimulos discriminativos para futuras respuestas instrumentales. D'Amato y 
Salmon (1982) utilizaron dos melodías diferentes como estímulos discriminativos 
con ratas y con monos, y Porter y Neuringer (1984) demostraron que las palomas 
eran capaces de discriminar la música de Bach de la de Stravinsky, y generalizar 
esta discriminación a música de otros compositores de los mismos períodos de la 
historia de la música. El hecho de que los procedimientos de discriminación del 
estímulo puedan utilizarse para poner a los amimales bajo el control de una 
amplia variedad de estímulos, convierte a los procedimientos de discriminación 
en herramientas poderosas para la investigación de las formas en que los anima- 
les procesan la información. Vamos a describir algunos frutos fascinantes de esta 
investigación en nuestra discusión sobre cognición animal de los capítulos 11 y 12. 


¿Qué se aprende en el entrenamiento de discriminación? 


Como ya se ha visto, si la respuesta instrumental se refuerza en presencia de 
un estímulo (E +) y no se refuerza en presencia de otro estímulo (E —), esos 
estímulos llegan a controlar la aparición de la conducta instrumental. Dado el 
profundo efecto que el entrenamiento de discriminación posee sobre el control 
por el estímulo, los investigadores están interesados en lo que los sujetos apren- 
den durante el entrenamiento de discriminación. Considérese la siguiente situa- 
ción relativamente simple: se refuerzan las respuestas siempre que una luz roja 
(E +) se enciende y no se refuerzan cuando se presenta un tono fuerte (E —). 
¿Qué estrategias podría utilizar el sujeto para asegurarse de que la mayoría de sus 
respuestas eran reforzadas en esa situación? Una posibilidad es que el sujeto 
aprenda simplemente a responder siempre que se presenta el E + y no aprenda 
nada en relación con el E —. Si se siguiera la regla «Responde sólo cuando el E + 
esté presente», el sujeto acabaría por responder mucho más al E + que al E — y 
obtendría los reforzadores disponibles. Otra posibilidad es que el sujeto aprenda a 
no responder durante el E —, pero no aprenda nada durante el E +. Esto consti- 
tuiría la regla siguiente: «Suprime las. respuestas sólo cuando E — esté presente». 
Si el sujeto siguiera esta regla terminaría por responder mucho más al E + que al 
E —. Una tercera posibilidad es que el sujeto aprenda a responder al E + y a no 
responder al E —. De esta forma, en el procedimiento de discriminación puede 
aprender algo sobre el significado de ambos estímulos. 


La teoría de Spence del aprendizaje de discriminación. Una de las las prime- 
ras y más influyentes teorías del aprendizaje de discriminación fue propuesta por 
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Kenneth Spence en 1936. Spence abogó por la tercera de las posibilidades descri- 
tas arriba. Según esta teoría, el reforzamiento de una respuesta en presencia del 
E + condiciona en el E + propiedades excitatorias que llegan a provocar la con- 
ducta instrumental en las futuras presentaciones de este estímulo. Por el contra- 
r10, se supone que el no reforzamiento de las respuestas durante las presentacio- 
nes del E — condiciona propiedades inhibitorias en el E — que sirven para 


inhibir la conducta instrumental en las futuras presentaciones del E —. Spence 
consideraba que la respuesta diferencial al E + y al E — refleja la excitación y la 
inhibición que se han condicionado al E + y al E —, respectivamente. 


¿Cómo podemos evaluar experimentalmente la teoría de la excitación-inhi- 
bición sobre el aprendizaje de discriminación? Como ya advertimos antes, la mera 
observación de que los sujetos responden más al E + que al E — no basta para 
afirmar que han aprendido algo acerca de ambos estímulos. Se requiere una 
prueba experimental más sofisticada. Una posibilidad consiste en utilizar los gra- 
dientes de generalización del estímulo."Si una tendencia excitatoria se ha condi- 
cionado al E +, entonces los estímulos que difieren cada vez más del E + debe- 
rían ser progresivamente menos eficaces para provocar la respuesta instrumental. 
En otras palabras, deberíamos de observar un gradiente de generalización empi- 
nado, que presenta la cantidad de respuestas más alta en E +. Este resultado 
recibe el nombre de gradiente de generalización del estímulo excitatorio. Si una 
tendencia inhibitoria se ha condicionado al E —, entonces los estímulos que difie- 
ren cada vez más del E — deberían ser progresivamente menos eficaces para 
inhibir la respuesta instrumental. A este resultado se le llama gradiente de gene- 
ralización del estímulo inhibitorio. 

Cuando Spence propuso su teoría, las técnicas conductuales no eran lo bas- 
tante sofisticadas para permitir una observación tal como la de los gradientes de 
generalización del estímulo inhibitorio y excitatorio que suponía su teoría. Sin 
embargo, las pruebas experimentales que se llevaron a cabo en décadas posterio- 
res probaron que sus ideas eran esencialmente correctas. En un importante expe- 
rimento, dos grupos de palomas recibieron un entrenamiento discriminativo con 
estímulos visuales antes de las pruebas de generalización del estímulo (Honig, 
Boneau, Burstein y Pennypacker, 1963). Un grupo de sujetos fue reforzado por 
picotear cuando la tecla de respuesta se iluminaba con una luz blanca que tenía 
una barra vertical negra superpuesta (E +) y no fue reforzado cuando la luz 
blanca se presentaba sin la barra vertical (E —). El segundo grupo de animales 
recibió el mismo tipo de entrenamiento de discriminación. Pero los E + y E— 
fueron a la inversa: la barra vertical negra hacía de E —, y la tecla blanca sin la 
barra hacía de E +. Después de que ambos grupos aprendieran a dar muchas más 
respuestas al E + que al E —, Honig y sus colaboradores llevaron a cabo pruebas 
de generalización del estímulo para ver cuánto control sobre la conducta instru- 
mental se había logrado en cada grupo. Los estímulos de prueba consistían en una 
barra negra sobre fondo blanco, con la barra inclinada en distintos angulos a 
partir de la posición vertical. 

En la figura 8.9 se resumen los resultados del experimento. Vamos a conside- 
rar primero los resultados del grupo 1, Recuérdese que en este grupo la barra 
vertical hacía de E + durante el entrenamiento discriminativo. Por tanto, esos 
sujetos llegaban a responder en presencia de la barra vertical. Durante la prueba 
de generalización, la tasa más alta de respuestas se producía cuando la barra se 
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Fagura 8.9. —Gradientes de generalización del estimulo para estímulos de inclinación de una barra en 
dos grupos de sujeros, después de un entrenamiento de discriminación. Para el grupo 1 una barra 
negra vertical sobre un fondo blanco sirvió como E+, y la luz blanca sin la barra como E—. Para el 
grupo 2 las funciones de los estímulos son las opuestas. (Según Honig, Boneau, Burstein y Pennypac- 


ker, 1963.) 


presentaba en la posición vertical original; a medida que la barra se iba inclinando 
cada vez más a partir de la vertical se observaban progresivamente menos res- 
puestas. Esos resultados indican que la posición vertical de la barra lograba un 
control sobre la conducta de picoteo cuando el estímulo hacía de E + . Vamos a 
considerar a continuación los resultados del grupo 2. En estos sujetos la barra 
vertical hacía de E — durante el entrenamiento de discriminación. Al final del 
entrenamiento de discriminación esos sujetos no picoteaban cuando la barra ver- 
tical se proyectaba en la tecla de respuesta. Los resultados de la prueba de genera- 
lización indicaban que el no responder a la barra vertical era debido a que se 
activaba la inhibición de la conducta de picoteo en respuesta a la posición vertical 
de la barra. Conforme la barra se iba inclinando a partir de la vertical, se iba 
produciendo progresivamente más picoteo. Los estímulos que eran cada vez más 
distintos del E — original producían progresivamente menos inbibición de la 
conducta de picoteo. 

_ Este experimento muestra que el entrenamiento discriminativo puede produ- 
cir tanto un condicionamiento excitatorio al E + como un condicionamiento inhi- 
bitorio al E —. Se obtenía un gradiente de generalización del estímulo alrededor 
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de la barra vertical cuando la barra hacía de E +, y un gradiente de generalización 
inhibitorio alrededor de la barra vertical cuando la barra hacía de E —. El gra- 
diente excitatorio tenía forma de U invertida, con un máximo de respuestas en el 
E + original. El gradiente inhibitorio tenía la forma contraria, con un mínimo de 
respuestas en el E — original. El hecho de que puedan presentarse gradientes de 
excitación y de inhibición alrededor del E + y el E — supone un apoyo grande a 
la teoría de Spence del aprendizaje discriminativo. 


El entrenamiento de discriminación sin error. Los resultados examinados 
arriba muestran que el entrenamiento de discriminación puede dar lugar a ten- 
dencias excitatorias condicionadas al E + y a tendencias inhibitorias condiciona- 
das al E — . $in embargo, este experimento no nos dice si todos los procedimien- 
tos de entrenamiento discriminativo producen los dos tipos de aprendizaje. De 
hecho, la investigación posterior ha mostrado que el entrenamiento discrimina- 
tivo no siempre da como resultado unas tendencias inhibitorias condicionadas al 
E — . En el procedimiento de discriminación característico, los estímulos E + y 
E — permanecen inalterables a lo largo del entrenamiento. En un primer 
momento, los sujetos responden durante ambas presentaciones, las del E + y las 
del E — (véase figura 8.6). Sin embargo, dado que el reforzamiento no está dis- 
ponible durante el E — , gradualmente se extingue la respuesta. En una seríe de 
experimentos importantes, Terrace (1964, 1966b) investigó si los sujetos pueden 
aprender una discriminación sin dar jamás una respuesta al E — ni experimentar 
el hecho de que las respuestas mo se refuerzan durante el E —. 

Terrace desarrolló un nuevo procedimiento discriminativo en el que los suje- 
tos dan muy pocas o ninguna respuestas durante el E — (estas respuestas son 
«errores»). La técnica consiste en una intensificación progresiva del estímulo 
E —. Vamos a suponer que deseamos entrenar palomas para que picoteen 
cuando se ilumina la tecla de respuesta con una luz roja y para que no picoteen 
cuando se ilumine con una luz verde. Si utilizáramos un procedimiento de discri- 
minación estándar, presentariamos los estímulos rojo y verde en ensayos alterna- 
tivos, y reforzaríamos la respuesta de picoteo sólo durante la luz roja. La intensi- 
dad y duración de los estímulos E + y E — permanecería igual a lo largo del 
entrenamiento. En el procedimiento de discriminación sin error de Terrace, el 
E + se presenta con la misma intensidad y duración en cada ensayo de E + a lo 
largo del entrenamiento (por ejemplo, Terrace, 1972). Sin embargo, esto no ocu- 
rre con el E —; el E — se intensifica gradualmente. Durante los ensayos iniciales 
del procedimiento de discriminación, el E — se presenta tan brevemente y a tan 
baja intensidad que los sujetos no responden a él. La duración y la intensidad del 
E — se incrementan gradualmente en los sucesivos ensayos con el E — conforme 
avanza el entrenamiento discriminarivo. Si esos aumentos graduales son lo sufi- 
cientemente pequeños, los sujetos nunca pueden responder al E —. Así pues, el 
procedimiento de intensificación permite que la discriminación se aprenda sin 
errores. 

Los primeros resultados sugirieron que el entrenamiento de discriminación 
sin error conduce a tipos fundamentalmente distintos de reacciones al E— que las 
técnicas de discriminación más convencionales. Como hemos visto, en el trans- 
curso del entrenamiento de discriminación estándar, el E — llega a inhibir acti- 
vamente la respuesta instrumental (véase figura 8.9). El E — se hace aversivo 
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para el sujero y puede provocar respuestas agresivas e intentos de escapar y evitar 
e] E —. Otro resultado posible del entrenamiento de discriminación convencional 
es el efecto de desplazamiento del máximo, descrito en la sección siguiente. 
Terrace halló que, después del entrenamiento de discriminación sin error, el E — 
no inhibe activamente las respuestas ni produce intentos de agresión, escape O 
evitación, y no se produce el efecto de desplazamiento del máximo. Por tanto, 
propuso que a lo largo del entrenamiento de discriminación es necesaria la ejecu- 
ción de respuestas no reforzadas al E — («errores») para que se inhiban activa- 
mente las respuestas y se produzcan los efectos colaterales del entrenamiento de 
discriminación convencional (por ejemplo, Terrace, 1972). Sin embargo, la inves- 
tigación subsiguiente ha mostrado que la ausencia de errores no es probablemente 
el factor esencial. Antes bien, puede que lo que impide que el E — se condicione a 
inhibir activamente las respuestas y producir los otros efectos emocionales que 
producen los estímulos E — adiestrados más convencionalmente, sea la técnica de 
intensificación utilizada para introducir el E — en el procedimiento sin errores 
(Rilling, 1977). 


Los efectos del entrenamiento de discriminación intradimenstonal 


Hasta ahora hemos discutido las características generales del entrenamiento 
de discriminación del estímulo que pueden hallarse con cualquier combinación de 
estímulos que hagan de E + y E — en un procedimiento de discriminación. 
Además de los efectos ya descritos, surgen ciertos problemas y fenómenos si en 
un procedimiento de discriminación el E + y el E — difieren uno de otro sólo en 
una característica estimular, tal como el color, el brillo o el tono. Los casos en que 
el E + y el E — son idénticos excepto en una característica estimular se llaman 
procedimientos de discriminación intradimensional. Considérese, por ejemplo, 
el entrenamiento de discriminación en el que el E + y el E — son idénticos en 
todos los sentidos excepto en el color. ¿Qué efecto tendrá la semejanza de color 
del E + y el E — en el control del E + sobre la conducta instrumental? ¿Estará 
- determinada principalmente la tasa de respuestas al E + por la disponibilidad del 
reforzamiento en presencia del Ef, o estará también influida la tasa de res- 
puestas al E + por la semejanza entre los colores del E + y el E —2 


El fenómeno de desplazamiento del máximo. En un importante experi- 
mento, Hanson (1959) investigó los efectos del entrenamiento de discriminación 
intradimensional para averiguar hasta qué punto los distintos colores controlaban 
la conducta de picoteo en las palomas. Todos los sujetos del experimento fueron 
reforzados por picotear en presencia de una luz cuya longitud de onda era de 
550 nanómetros. Así pues, el E + fue el mismo para todos los animales. Los 
grupos diferían en la semejanza entre el E + y el E —. Un grupo, por ejemplo, 
recibía entrenamiento de discriminación en el que el E— era un color de 590 nm. 
En otro grupo el E — era mucho más parecido al E +; la longitud de onda del 
E — era de 555 nm, a sólo 5 nm del estímulo E +4. La actuación de estos sujetos 
se comparó con la conducta de un grupo de control que no había recibido entre- 
namiento de discriminación, pero al que también se reforzó por picotear en pre- 
senciía del estímulo E + de 550 nm. Después de estos diferentes entrenamientos, 
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APARTADO 8.2. Aplicaciones en la educación de los procedimientos de discreminación 
sm error 


Los educadores se han interesado por los procedimientos utilizados por Terrace para 
enseñar discriminaciones sin errores. Los textos de enseñanza programada confían plena- 
mente en las técnicas de intensificación. La idea consiste en ir presentando marerial desco- 
nocido en sucesivos pasos, lo suficientemente pequeños para que el sujeto vaya alcanzando 
fácilmente una comprensión del material que se le muestra. La información se suele pre- 
sentar utilizando un formato de preguntas y respuestas. Las preguntas están diseñadas de 
manera que el estudiante cometa pocos errores al responder. Cualquiera que haya trabajado 
con un texto de enseñanza programada sabe que, sin duda, es posible aprender sin cometer 
errores. Desgraciadamente, los pequeños pasos en que se presenta la información pueden 
convertir el trabajo con un texto de enseñanza programada en algo lento y tedioso. 

En otra aplicación, Gary La Vigna (1977) desarrolló un programa de discriminación sín 
error para enseñar a los niños autistas un sistema de lenguaje escrito con el que comuni- 
carse. Todos los niños eran en un principio mudos y presentaban una variedad de sintomas 
psicóticos típicos del aurismo. El objetivo inmediato era enseñar a los niños a identificar 
los objetos mediante etiquetas impresas. En la parte del programa que vamos a describir 
los aiños aprendieron a identificar tres tipos de dulce (caramelos mentolados, chicle y 
dulce de maíz) con tarjetas impresas. Si los niños identificaban el dulce con la tarjeta 
correcta, se comían el dulce, El número de tarjetas de identificación y la fuerza de la 
impresión (las letras se iban intensificando) aumentaban poco a poco como en el entre- 
namiento de discriminación sin error. La figura 8.10 muestra una serie de ensayos de 
muestra. En el primer ensayo, para enseñar «menta» sólo se presentaba una tarjeta 
impresa. En el segundo ensayo, se presentaba la etiqueta correcta y una tarjeta en blanco. 
Gradualmente, las letras impresas en la segunda tarjera iban apareciendo. En ese momento 
se presentaba el chicle. Como en el primer ensayo, al principio sólo se presentaba una 
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Figura 8.10.—Estimulos dulces y tarjetas disponibles en los sucesivos pasos de la muestra en un 
programa de lenguaje. (Según La Vigna, 1977.) 
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tarjeta de respuesta, Después se presentaban a la vez las tarjetas de «chicle» y «menta». 
Poco a poco se iba añadiendo de forma similar una tercera rarjeta. Finalmente, los niños 


aprendían a identificar los tres dulces con las etiquetas correctas y lo hacían con pocos 
errores. 


Se ha visto que los procedimientos de discriminación sin error son muy útiles en 
numerosas situaciones de educación especial, tal como el entrenamiento de individuos con 
retraso mental Una ventaja importante es que al minimizar los errores en el aprendizaje 
se minimizan las frustraciones y decepciones que surgen de los fallos, haciendo así la 
situación de aprendizaje más agradable y estimulante, 
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se comprobó la tasa de picoteo de todos los sujetos en presencia de estímulos de 
distintas longitudes de onda. 

En la figura 8.11 se muestran los resultados. Vamos a considerar primero el 
rendimiento del grupo de control. Estos animales mostraron las tasas más altas de 
respuesta al estímulo E +, y se producían progresivamente tasas más bajas de 
respuesta conforme los sujetos se enfrentaban a estímulos progresivamente dife- 
rentes del E +. Así pues, el grupo de control mostraba el gradiente normal de 
generalización del estímulo excitatorio respecto al E +. Los animales que habían 
recibido entrenamiento de discriminación con el color de 590 nm como E — 
arrojaron resultados ligeramente diferentes. También respondieron con tasas 
altas al color de 550 nm que había hecho de E +. Sin embargo, esos sujetos 
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Figura 8.11.—Efectos del entrenamiento de discriminación intradimensional en el control por el es- 

tímulo. Tres grupos de palomas fueron reforzados por picotear en presencia de una luz de 550 nm 

(E+). Un grupo recibió un entrenamiento de discriminación en el que el E— era una luz de 590 nm 

Otro grupo recibió un entrenamiento de discriminación en el que el E— era una luz de 555 am. El 

tercer grupo sirvió como control y no recibió un entrenamiento de discriminación previo a la prueba 
de generalización del estímulo. (Según Hanson, 1959.) 
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mostraron mucha más generalización de la respuesta de picoteo al color de 
540 nm. De hecho, su tasa de respuesta era ligeramente más alta al color de 
540 nm que al E + original de 550:nm. Este desplazamiento del máximo de las 
respuestas respecto al E + original era incluso más espectacular en sujetos que 
habían recibido entrenamiento de discriminación con el color de 555 nm como 
E —. Esos sujetos mostraron tasas de respuestas al E + original (550 nm) mucho 
más bajas que los otros dos grupos. Además, sus tasas de respuesta más altas se 
producían ante los colores de una longitud de onda de 540 y 530 nm. Este despla- 
zamiento del máximo del gradiente de generalización respecto al E + original es 
llamativo porque, en la primera fase del entrenamiento de discriminación, las 
respuestas nunca sé reforzaban en presencia de los estímulos de 540 o de 530 nm. 
Las tasas más altas de picoteo se producían ante estímulos que nunca se habían 
presentado durante el entrenamiento inicial. 

El desplazamiento del máximo del gradiente de generalización respecto al 
E + original se llama fenómeno de desplazamiento del máximo. Los resultados 
del experimento de Hanson indican que el efecto de desplazamiento del máximo 
se produce cuando se realiza un entrenamiento de discriminación intradimensio- 
nal. En el grupo-de control, que no había recibido entrenamiento discriminativo, 


ía-desplazamientó del”táximo del gradiente de. generalización Br" 


máximo del gradiente de generalización se aleja del É + en una dirección opuesta 
al estímulo que.se usó como E —én el procedimiento de discriminación. Además, 
el efecto de desplazamiento del máximo era función de la semejanza entre los 
E — y el E + utilizados en el entrenamiento de discriminación. El mayor despti- 


en el máximo de respuestas se obtenía con sujetos en los que el E — 


-—había-sido-muy-smilar aL ESF1533 00, trente-550-nm): El éfecto de desplaza- 


miento del máximo fue mucho menor para los sujetós que habían recibido 
entrenamiento de discriminación con más amplitud de colores (590 nm frente a 
550). (Véase Moye y Thomas, 1982; Weiss y Schindler, 1981, para ejemplos más 
recientes.) 


El aprendizaje de trasposición y relacional. El efecto de desplazamiento del 
máximo es llamativo porque muestra que el único estímulo en cuya presencia las 
respuestas se refuerzan (el E + ) no es necesariamente el estímulo que provoca la 
tasa más alta de respuestas después del entrenamiento de discriminación intradi- 
mensional. Este tipo de resultados puede también observarse en situaciones de 
elección. Kóhler (1939), por ejemplo, dejó a unos pollos que eligieran entre dos 
estímulos que diferían en brillo. Los dos estímulos eran grises, pero uno era lige- 
ramente más claro que el otro. Los sujetos eran reforzados por elegir el estimulo 
más claro (véase figura 8.12); el estímulo más claro era el E + . Después que los 
sujetos aprendieron a seleccionar el estímulo más claro, Kóhler introdujo una 
prueba interesante. Presentó el E + original, pero esta vez la alternativa consistía 
en un estímulo que era incluso más claro que el antiguo E +. Así pues, la rela- 
ción entre las alternativas estimulares era la misma durante la prueba que la que 
había existido durante el entrenamiento original: un estímulo era más claro que el 
otro. Los estímulos de prueba suponían una trasposición de la relación «más claro 
que» entre los E + y E — originales. ¿Picotearían los pollitos el E + con el que 
habían recibido reforzamiento al picotear durante el período de entrenamiento, o 
picotearían el nuevo estímulo alternativo, más claro aún? De forma significativa, 
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Figura 8.12.—El fenómeno de 
trasposición. Durante el adiestra- 
miento, el sujeto es reforzado 
por elegir la más clara de dos 
tonalidades de gris. Durante la 





E— ESP Eb Estímulo sesión de prueba se le da al suje- 
E nuevo co a elegir entre el E+ original 
Adiestramiento Prueba de trasposición y un nuevo estímulo, que tiene 


; una tonalidad más clara de gris 
que el E+, El nuevo estímulo es el elegido durante la sesión de prueba. 


los pollitos picotearon la alternativa «más clara»: respondían más al nuevo estímu- 
lo, al gris más claro, que a la tonalidad media del gris que habían aprendido a 
picotear durante la fase inicial del entrenamiento de discriminación. A este fenó- 
meno se le llama trasposición. 

Kohler explicó estos hallazgos recurriendo al concepto de aprendizaje rela- 
cional. Propuso que durante el entrenamiento con estímulos que difieren en una 
propiedad estimular concreta, los sujeros aprenden a responder en base a la rela- 


ción entre los estímulos más que en base a sus características estimulares absolu- 


tas. Ásí pues, en este experimento los pollitos aprendieron presumiblemente a 
responder en base a la relación entre el brillo de los dos estímulos presentes en 
un ensayo determinado: aprendieron a picotear la más clara de las dos teclas 
disponibles. Durante la sesión de prueba, el más claro de los dos estímulos era 
uno que ellos no se habían encontrado antes. Sin embargo, dado que los sujetos 
estaban respondiendo en base al brillo relativo de los estímulos, eligieron de 
nuevo el estímulo más claro aun cuando esto significara rechazar el E+ original. 
Los estímulos de prueba consistían en una trasposición de los estímulos origina- 
les, de tal forma que la relación que existía entre las dos teclas durante el entre- 
namiento (una más clara que la otra) se mantenía durante la sesión de prueba, 
Presumiblemente la repetición de la relación original entre los estímulos de 
prueba controló la conducta de elección. 


_ El aprendizaje relacional frente al estimular en la discriminación intradimen- 
ssonal. Los fenómenos de desplazamiento del máximo y de elección trasposicio- 
nal parecen poner en cuestión la idea de que son las características estimulares 
absolutas de los acontecimientos que señalan la disponibilidad del reforzamiento 
las que adquieren un control sobre la respuesta instrumental. Esos fenómenos 
parece que se corresponden también con la noción de que el aprendizaje discrimi- 
nativo implica el aprendizaje de tendencias excitatorias respecto al E + y de ten- 
dencias inhibitorias respecto al E — . ¿Se pueden explicar los fenómenos de des- 
plazamiento del máximo y de trasposición en términos de los gradientes exci- 
tatorios e inbibitorios que hemos supuesto que se desarrollan como resultado del 
entrenamiento de discriminación, o tenemos que aceptar mecanismos diferentes, 
tales como el aprendizaje relacional? En un análisis ingenioso, Spence (1937) 
sugirió que los gradientes excitatorios e inhibitorios pueden de hecho producir los 
efectos de desplazamiento del máximo y de trasposición. Su análisis es particu- 
larmente llamativo porque fue propuesto 20 años antes de que el efecto de des- 
plazamiento del máximo fuera demostrado experimentalmente. 


, 


tg 
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Tonos de gris progresivamente más claros —————- 


Figura 8.13.—Modelo de Spence del aprendizaje de discriminación intradimensional. Se considera que 

los gradientes de generalización de los estímulos excitatorio e imhibitorio (curvas discontimuas) se 

estabilizan alrededor de E+ y E—, respectivamente. La conducta del sujeto se predice a partir del 

gradiente neto de generalización (curva continua), que es calculado restando el gradiente inhibitorio al 
gradiente excitarorio. 


La explicación de Spence sobre el desplazamiento del máximo y la trasposi- 
ción se basa en dos suposiciones. En primer lugar, Spence supuso que el entrena- 
miento de discriminación intradimensional produce gradientes de generalización 
del estímulo excitatorio e inhibitoria centrados en el E + y el E —, respectiva- 
mente. En segundo lugar, supuso que la tendencia a responder ante un estímulo 
concreto viene determinada por la excitación generalizada a ese estímulo menos 
la inhibición generalizada a ese estímulo. Al sustraer el supuesto gradiente de 
inhibición centrado en el E — del supuesto gradiente de excitación centrado en el 
E +, Spence fue capaz de predecir tanto el fenómeno de desplazamiento del 
máximo como el fenómeno de trasposición. 

Considérese, por ejemplo, dos estímulos grises que sean muy similares 
excepto en que uno es algo más claro que el otro. Vamos a suponer que en un 
procedimiento de discriminación el estímulo más claro hace de E + y la tonalidad 
del gris más oscura hace de E —. Lo que se aprende sobre los E + y E — se 
generaliza presumiblemente a lo largo de las tonalidades del gris. La figura 8.13 
muestra los gradientes de generalización excitatorio e inhibitorio que se van a 
desarrollar presumiblemente alrededor de los estímulos E + y E —. Adviértase 
que dado que el E + y el E — son similares en lo que respecta a la propiedad 
estimular, los gradientes excitatorios e inhiíbitorios se solapan en cierta medida. 
Para predecir el nivel de respuesta que va a producirse ante distintas tonalidades 
de gris tenemos simplemente que restar el nivel de inhibición que presumible- 
mente se va a generalizar a un estímulo concreto del nivel de excitación generali- 
zado a ese estímulo. El gradiente inhibitorio de la figura 8.13 no se extiende a los 
estímulos E3 y E4. Por tanto, para esos estímulos de prueba, la inhibición genera- 
lizada no se resta de la excitación generalizada. La cantidad más grande de inhibi- 
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ción se. resta de la fuerza excitatoria generalizada del estímulo E —, siendo sus- 
traídas menores cantidades del E + y de los estímulos de prueba El y E2. Los 
puntos que e conectan con la línea continua en la figura 8.13 representan la 
fuerza excitatoria neta del E —, del E + y de los estímulos de prueba desde del 
El hasta el E4. 

El gradiente excitatorio neto en la figura 8.13 es una predicción de la conducta 
del sujeto. Esta predicción es coherente tanto con el desplazamiento del máximo 
como con la trasposición. Adviértase que el máximo del gradiente neto de genera- 
lización calculado en la figura 8.13 no está en el E + sino que se ha desplazado 
respecto al E + en una dirección opuesta al E —. Esto es precisamente lo que se 
observa en los experimentos de desplazamiento del máximo (véase la fipu- 
ra 8.11). El gradiente neto de generalización también predice la trasposición si a 
los sujetos se les da a elegir entre dos estímulos dentro de una cierta gama de 
tonalidades del gris. Si a los sujetos se les ofrece una elección entre el E + origi- 
nal y el E —, ellos elegirán el E + (el más claro de los dos estímulos) porque la 
fuerza excitatoria neta más grande se asocia con el E +. Si a los sujetos se les 
ofrece una elección trasposicional entre el E + y un nuevo estímulo El, que es 
una tonalidad más clara de gris que el E +, elegirán el nuevo estímulo porque el 
El posee una fuerza excitatoria neta mayor que el E +. Según los datos de la 
figura 8.13 se seleccionará el más claro de los dos estímulos si se ofrece a los 
sujetos la posibilidad de una elección entre El y E2. Así pues, se predice el 
fenómeno de la trasposición entre los estímulos El y E2 en la dimensión de las 
tonalidades del gris. Sin embargo, si los sujetos pasan por pruebas con los estímu- 
los E2 y E3, ya no elegirán más la tecla más clara. Por el contrario, en esta prueba 
de elección, el modelo de Spence predice que seleccionarán el más oscuro de los 
dos estímulos (E2) porque E2 tiene una fuerza excitatoria neta mayor que E3. 
Así pues, el modelo de Spence del aprendizaje de discriminación intradimensional 
no sólo predice que la trasposición va a tener lugar, sino que también indica que 
el fenómeno se limita a los estímulos cercanos al E + y al E — en la dimensión 
estimular. El trabajo experimental posterior ha confirmado que el fenómeno de la 
trasposición se viene abajo cuando los sujetos realizan pruebas con estímulos que 
tienen poca semejanza con los estímulos del entrenamiento inicial (por ejemplo, 
Kendler, 1950; Spence, 1937). 

Las predicciones precisas con el modelo de Spence dependen de la forma 
exacta de los gradientes excitatorios e inhibitorios que se considera que existen 
alrededor de el E + y el E — , respectivamente. En los tiempos en que Spence 
propuso este modelo, no se disponía de técnicas experimentales para obtener 
pruebas directas de los gradientes excitatorio e inhibitorio y de sus efectos netos. 
Sin embargo, las investigaciones llevadas a cabo más recientemente con técnicas 
modernas de condicionamiento operante han suministrado pruebas sorprendentes 
de la existencia de los gradientes de generalización que Spence suponía que ser- 
vían de base para el desplazamiento del máximo y la trasposición (véase Hearst, 
1968, 1969; Klein y Rilling, 1974; Marsh, 1972). Así pues, las pruebas de genera- 
lización del estímulo han proporcionado habitualmente datos que apoyan el 
modelo de Spence. Sin embargo, los datos acerca de la forma en que los sujetos 
realizan elecciones entre estímulos cuestionan el éxito del modelo. El modelo 
encuentra particular dificultad para explicar los resultados del problema de la 
elección intermedia. 
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En el problema de la elección intermedia, los sujetos son reforzados por selec- 
cionar el estímulo intermedio en un grupo de tres. Durante el entrenamiento 
Inicial, los sujetos pueden estar expuestos a tres cuadrados de diferentes tamaños, 
por ejemplo, y ser reforzados por seleccionar el cuadrado de tamaño intermedio 
(véase figura 8.14). Los sujetos pueden aprender una discriminación como ésta 
sin demasiada dificultad. Adviértase que en este caso existen, en lo que respecta a 
la dimensión del tamaño, dos estímulos incorrectos (E —), uno a cada lado del 
estímulo correcto (E +). Spence predecía que alrededor de cada estímulo E — se 
desarrollarían gradientes de generalización inhibitoria y que se desarrollaría un 
solo gradiente excitarorio alrededor del E + (véase figura 8.14). Si los gradientes 
inhibitorios se restan del gradiente excitatorio, el resultado neto es un gradiente 
excitatorio que se encuentra en el E + original (véase figura 8.14). Asociada con 
el E + original aparece la mayor excitación neta. Por tanto, el modelo de Spence 
predice que sí los sujetos pasan por pruebas con un nuevo grupo de tres estímu- 
los, siempre escogerán cualquier estímulo que resulte más semejante al E + ori- 
ginal, ya sea éste o no un estímulo de tamaño intermedio. Sin embargo, en contra 
de esta predicción, la investigación ha mostrado que los sujetos a veces siguen 
escogiendo el estímulo de tamaño intermedio cuando pasan por pruebas con nue- 
vos conjuntos de tres estímulos (por ejemplo, González, Gentry y Bitterman, 
1954). Así pues, en el problema de elección intermedia, los sujetos pueden res- 
ponder basándose en la relación entre los estímulos antes que en las característi- 
cas absolutas del E +. 

¿En qué lugar dejan todas estas pruebas la interpretación de los efectos del 
entrenamiento de discriminación intradimensional? Sin duda, la explicación del 
aprendizaje relacional no es totalmente correcta ni totalmente incorrecta. Del 


Excitación 
———— O ——— y 


Inhibición 





Recuadros progresivamente más grandes — -— —+» 


Figura 8.14 — Análisis del problema de la elección intermedia de acuerdo con la teoría de Spence sobre 
el aprendizaje de discriminación. A los sujetos se les presentan tres estímulos, y son reforzados por 
escoger el intermedio (por ejemplo, el de tamaño intermedio). Se supone que alrededor de! estímulo 
de tamaño intermedio (E +) se establece un gradiente excitatorio, y que los gradientes inhibitorios se 
desarrollan alrededor de los estímulos no reforzados (E —). (Las líneas disconriauas representan estos 
gradientes.) El gradiente nero excitatocio (línea continua) está centrado en el E+ original. 
BraQIéDptes.) El gradiente nero excttatorio (línea continua) está centrado en el E+ original. 
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mismo modo, un análisis en términos del aprendizaje de características especificas 
del estímulo no es tampoco totalmente correcto mi totalmente incorrecto. Las 
pruebas indican que los animales pueden aprender a responder basándose en una 
relación entre los estímulos reforzados y los no reforzados. También pueden 
aprender basándose en las características absolutas del E + y el E —. Puede ser 
que con la generalización del estímulo y con las pruebas de elección trasposicional 
se estén midiendo aspectos diferentes del aprendizaje. En las pruebas de generali- 
zación del estímulo, los resultados reflejan, sin duda, lo que han aprendido los 
animales sobre las características específicas del estímulo. En las pruebas de gene- 
ralización los sujetos no pueden responder basándose en una relación entre los 
estímulos porque son expuestos a un solo estímulo cada vez. Por el contrario, es 
probable que las pruebas de elección reflejen tanto el aprendizaje estimular como 
el aprendizaje relacional. Los resultados indican que pueden producirse los dos 
tipos de aprendizaje. 


Un enfoque de respuesta múltiple del entrenamiento de discriminación 


Las perspectivas teóricas sobre el aprendizaje de discriminación que hemos 
discutido hasta ahora han analizado el aprendizaje de discriminación solamente 
en términos de la respuesta condicionada al E +. Las distintas teorías difieren al 
suponer que los sujetos responden al E + basándose en las características absolu- 
tas del estímulo, o basándose en las características relacionales entre el E + y el 
E —, pero coinciden en que la presencia o ausencia de la respuesta Instrumental 
reforzada es el problema fundamental en el análisis del control por el estímulo. 
La falta de respuestas al E — ha sido tratada como un reflejo de la inhibición de 
la respuesta instrumental reforzada. Por esta razón, todos los diversos fenómenos 
del aprendizaje de discriminación fueron explicados como resultado de un proceso 
en el que los diferentes estímulos provocaban la excitación y la inhibición diferen- 
cial de una única conducta. 

Staddon (1983) describió recientemente un importante enfoque alternativo 
del aprendizaje de discriminación, que considera no sólo la respuesta instrumental 
reforzada, sino también otras actividades del organismo que no están relacionadas 
con el reforzador. La teoría trata la respuesta instrumental reforzada y las otras 
conductas del organismo como dos categorías de respuesta separadas, y se refiere 
a ellas como respuestas terminales e ínterin. Ya encontramos esas categorías de 
respuestas en nuestra discusión del experimento de Staddon y Simmelhag acerca 
de la forma en que responden las palomas a la comida presentada de forma 
periódica (véase «Respuestas de interin y respuestas terminales», capítulo 7). Las 
respuestas terminales son actividades tales como el picoteo que se producen como 
un anticipo del reforzador, y las respuestas de ínterin son actividades tales como dar 
vueltas O andar, que se producen cuando es improbable la recompensa. En un 
procedimiento de discriminación. instrumental la respueta terminal es la res- 
puesta instrumental reforzada y las respuestas de interin son otras actividades del 


sujeto. 
La teoría de Staddos supone que la respuesta instrumental se condiciona al 
E + y las respuestas de ínterin se condicionan al E — . Se considera que ambas 


tendencias de respuesta se generalizan para todo un conjunto de estímulos seme- 
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jantes. Según esta teoría, que un estímulo de prueba determinado provoque la 
respuesta instrumental adecuada para el reforzador depende de la competencia 
que proveniente de las respuestas de ínterin que pueden también ser desencade- 
nadas por el estímulo de prueba, recibe la respuesta instrumental. Si la respuesta 
instrumental es elicitada con más intensidad que las respuestas de interin, se 
observa la respuesta instrumental; si las respuestas de ínterin son elicitadas más 
intensamente que la respuesta instrumental, se suprime la respuesta instrumen- 
tal. Así pues, la supresión de la respuesta instrumental en presencia del E — no 
se considera causada por la inhibición de esa conducta, sino por la fuerte compe- 
rencia de las respuestas de ínterin elicitadas por el E — Esto representa un gran 
contraste con la teoría del aprendizaje discriminativo de Spence. Al contrario que 
Spence, Staddon no confía en el concepto de inhibición. El concepto de inhibición 
es reemplazado por el de competencia entre las respuestas instrumentales y las 
respuestas de interin. l 

La hipótesis de Staddon acerca del aprendizaje de discriminación predice todos 
los fenómenos de discriminación y de generalización del estímulo ya discutidos y 
que también predecía la teoria de Spence. Queda por ver el éxito que consigue 
la hipótesis de Staddon en la predicción correcta de nuevos hallazgos. La evalua- 
ción de la teoría requerirá medir no sólo las respuestas instrumentales terminales, 
sino también las respuestas de ínterin. Este enfoque de respuesta múltiple segu- 
ramente revelará información importante sobre el control estimular de la con- 
ducta. Es obvio que los animales hacen otras cosas cuando mo ejecutan la res- 
puesta instrumental requerida debido a la presencia del E —. Un mejor conoci- 
miento de esas otras actividades, y de los factores que determinan su intensidad, 
llevará a una comprensión más completa de los efectos del entrenamiento de 
discriminación. Del mismo modo que los enfoques de respuesta múltiple han 
revolucionado muestra concepción del reforzamiento (véase capítulo 7), esos 
enfoques pueden también llegar a revolucionar nuestras concepciones del control 
por el estímulo. 


El control por los elementos de un estímulo compuesto 


En la discusión sobre el control por el estímulo que hemos llevado a cabo 
hasta ahora hemos planteado la forma en que los organismos responden a estí- 
mulos individuales (una luz roja o verde, por ejemplo, o una línea vertical u 
horizontal). Sin embargo, los estímulos nunca se producen individualmente. 
Incluso un estímulo simple, como una tecla circular para picotear iluminada con 
una luz roja, puede considerarse más apropiadamente un estímulo compuesto con 
varios elementos estimulares. Entre esos elementos se incluye, por ejemplo, la 
longitud de onda de la luz roja, su brillo, la forma de la tecla de respuesta, y su 
localización. Una situación fuera del laboratorio puede ser aún más compleja. 
Durante un partido de fútbol, por ejemplo, los gritos de entusiasmo son reforza- 
dos con la aprobación social si la gente de nuestro alrededor apoya al mismo 
equipo. El estímulo discriminativo para los vítores consiste en un rico conjunto de 
estímulos visuales que incluye que nuestro equipo haya marcado un gol, el sonido 
del altavoz anunciando el gol, y las complejas claves auditivas y visuales que nos 
proporcionan las personas que gritan de entusiasmo a nuestro lado. La mayoría 
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de los estímulos discriminativos fuera del laboratorio son igualmente complejos. 
Considérese, por ejemplo, el estímulo discriminativo que mos dice que pademos 
empujar el carro de la compra hasta la caja. El cliente anterior a nosotros tiene 
que haber acabado de realizar su operación, el pasillo tiene que quedarse libre de 
carros, y probablemente el cajero dirá algo así como «el siguiente», y, si vacila- 
mos, es probable que las personas que están detrás de nosotros en la cola también 
tengan algo que decir. 

¿Qué determina cuáles y cuántos de los elementos de un estímulo compuesto 
adquieren el control de la conducta instrumental? La hipótesis del empareja- 
miento supone que todos los elementos perceptibles del estimulo que está pre- 
sente mientras se refuerza una respuesta adquieren un control sobre esa res- 
puesta. Aunque esto pueda en un sentido ser asi, evidentemente no todos los 
elementos del estímulo adquieren el mesmo control sobre la respuesta instrumen- 
tal, Algunos elementos llegan a ejercer una influencia mucho más fuerte que otros 
sobre la conducta instrumental. En la presente sección vamos a considerar algu- 
nos factores que determinan qué elementos de un estímulo compuesto acaban por 
predominar en el control de la aparición de la conducta instrumental. 

Los estímulos compuestos tan complejos como los que encontramos en un 
partido de fútbol o en la caja del supermercado son difíciles de analizar experi- 
mentalmente. Los estudios de laboratorio sobre la forma en que los elementos de 
un estímulo compuesto llegan a controlar la conducta instrumental se han llevado 
a cabo con conjuntos de sólo dos elementos simples, tales como una luz y un tono. 
La investigación ha mostrado que el que sea un elemento u otro de un estímulo 


compuesto el que adquiera el control sobre la conducta instrumental depende de ' 


su eficacia relativa como señal para el reforzamiento, del tipo de reforzamiento 
usado, de las respuestas que los sujetos necesitan ejecutar para conseguir un 
reforzamiento, y de la facilidad relativa de condicionamiento de los elementos del 
estímulo. 


La eficacia relativa de los elementos del estímulo como señales para el refor- 
zamiento. Ya advertimos en el estudio del condicionamiento clásico que el valor 
de señal del EC es un factor importante para el condicionamiento. El simple 
emparejamiento del EC con el El no produce necesariamente el condiciona- 
miento. Si se presenta el El en presencia y en ausencia del EC, el EC puede no 
condicionarse aunque se le empareje periódicamente con el El. Se han observado 
hallazgos similares con los estímulos discriminativos. Los procedimientos utiliza- 
dos en una investigación de este tipo (Wagner, Logan, Haberlandt y Price, 1968) 
se resumen en la figura 8.15. Fueron condicionados dos grupos de ratas con un 
procedimiento de ensayo discreto en el que los sujetos eran reforzados el 50 por 
100 de los ensayos por presionar una palanca en presencia de un estímulo com- 
puesto, que consistía en una luz y un sonido de dos posibles. Con ambos grupos, 
en la mitad de los ensayos uno de los sonidos (tono 1) se presentaba simultánea- 
mente a la luz, y el otro (tono 2) se presentaba simultáneamente a la luz en los 
ensayos restantes. En el grupo 1, las respuestas se reforzaban el 50 por 100 de los 
ensayos en los que se presentaba el estímulo compuesto luz-tono 1 y el 50 por 
100 de los ensayos en que se presentaba la luz-tono 2. 

Antes de describir el procedimiento para el grupo 2, vamos a considerar el 
valor predictivo relativo de los dos tonos y del estimulo de la luz en el procedi- 
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Grupo 1 Figura 8.15.—Diagrama del ex- 
. rie de Wagner, Logan, 
de de aberlandt y Price (1968). Con 
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ho predecía mejor el reforzamiento 
para el grupo 1 que para el 
grupo 2. Consecuentemente, los 
sujetos respondieron más a la 


luz en el grupo 1 que en el 2. 
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miento con el grupo 1. Adviértase que los sujetos recibían el reforzamiento por 
responder sólo el 50 por 100 de las veces que se presentaba el tono 1. El proce- 
dimiento también administraba reforzamiento el 50 por 100 de las veces que se 
presentaba el tono 2. Por último, los sujetos eran reforzados también el 50 por 
100 de las veces que aparecía la luz, aun cuando la luz se presentaba un número 
total de ensayos mayor que cada uno de los tonos. Dado que el reforzamiento se 
administraba el 50 por 100 de las veces que se presentaba el tono 1, el tono 2 y la 
luz, los tres estímulos resultaron igual de buenos predictores en esa situación. 

En muchos aspectos, el procedimiento con el grupo 2 fue similar al del gru- 
po 1. De nuevo se presentó el tono 1 junto con la luz en la mitad de los ensayos, y 
el tono 2 se presentó con la luz en los ensayos restantes. Sin embargo, esta vez el 
reforzamiento estaba siempre disponible en los ensayos con el estímulo com- 
puesto luz-tono 1. Por el contrario, las respuestas nunca se reforzaban en los 
ensayos con el estímulo luz-tono 2. Este procedimiento aseguraba que, como en el 
grupo 1, el reforzamiento estaba disponible el 50 por 100 de las veces que se 
presentaba el estímulo de la luz, Sin embargo, esta vez el estímulo de la luz no fue 
tan buen predictor de la disponibilidad del reforzamiento como el tono 1. De los 
tres estímulos, el tono 1 fue el mejor predictor del reforzamiento porque los 
sujetos podían obtener el reforzamiento el 100 por 100 de los ensayos en que se 
presentaba este sonido. El tono 2 fue el predictor menos válido del reforzamiento 
porque los sujetos no fueron nunca reforzados en los emsayos con el tono 2. El 
valor de la luz como señal para el reforzamiento fue un valor intermedio entre los 
dos tonos. 

En relación con los sonidos del experimento, el estímulo de la luz fue un 
predictor mejor de la disponibilidad del reforzamiento para el grupo 1 que para el 
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grupo 2. Por tanto, si el valor predictivo de las claves es importante para deter- 
minar el control por el estímulo, sería de esperar que la luz tuviera un control 
mayor sobre la conducta de los animales en el grupo 1 que en el grupo 2. Esto es 
precisamente lo que observaron Wagner y sus colaboradores. Al final del experi- 
mento, en las pruebas en que el estímulo de la luz se presentaba solo los sujetos 
del grupo 1 daban muchas más respuestas que los sujetos del grupo 2. Es impor- 
tante darse cuenta que este resultado no puede explicarse en términos del porcen- 
taje de tiempo que el reforzamiento estaba disponible cuando se presentaba el 
estímulo de la luz. Tanto en el grupo 1 como en el 2, los sujetos podrían obtener 
el reforzamiento en el 50 por 100 de los ensayos en que se presentaba la luz. La 
diferencia esencial entre los grupos 1 y 2 era que, en relación con los otros estí- 
mulos de la situación (tonos 1 y 2), la luz era un predictor mejor del reforza- 
miento en el grupo 1 que en el grupo 2. 

Resultados como los obtenidos por Wagner y otros (1968) indican claramente 
que la hipótesis por el emparejamiento no basta para explicar el control del estí- 
mulo. Los dos grupos del experimento recibieron el mismo número de empare- 
Jjamientos del estímulo de la luz con el reforzamiento, Los resultados sugieren que 
los estímulos discriminativos tienen un poderoso efecto sobre la conducta no sólo 
porque están emparejados con el reforzamiento, sino porque señalan la forma o 
el momento en que se va a obtener un reforzamiento. Del mismo modo, si un 
estímulo es un mejor predictor de la disponibilidad del reforzamiento que otro, es 
más probable que adquiera el control de la conducta instrumental. 


Los efectos del tipo de reforzamiento sobre el control por el estímulo. El 
control por el estímulo depende no sólo de la eficacia relativa del estímulo como 
señal para el reforzamiento, sino también de la naturaleza del reforzador. Ciertos 
tipos de estímulos tienen más probabilidades de ejercer un control sobre la res- 
puesta instrumental con el reforzamiento positivo que con el reforzamiento nega- 
tivo. Esta relación se ha demostrado muy claramente en los experimentos con 
palomas (véase LoLordo, 1979, para una revisión). En uno de los estudios, por 
ejemplo, recibieron entrenamiento de discriminación en que se presionaba un 
pedal para obtener comida en presencia de un estímulo compuesto por una luz 
roja y un sonido de 440 Hz (Foree y LoLordo, 1973). Las respuestas en ausencia 
del estímulo compuesto no fueron reforzadas. En un grupo de animales, el refor- 
zamiento por presionar el pedal en presencia de un estímulo E-+ de luz-sonido 
consistía en comida. En el otro grupo, presionar el pedal era reforzado con la 
evitación de una descarga. Si esos sujetos presionaban el pedal en presencia del 
E+ no se administraba ninguna descarga en ese ensayo; si no respondían durante 
el E+ se les aplicaba periódicamente una breve descarga hasta que se producía la 
respuesta. Ambos grupos de palomas aprendieron la discriminación. Los animales 
presionaban el pedal con mucha más frecuencia en presencia del estímulo luz- 
sonido que en su ausencia. Una vez que esto había ocurrido, Foree y LoLordo 
trataron de determinar cuál de los dos componentes del E + complejo, la luz o el 
sonido, era el principal responsable de la respuesta durante el E+. Los sujetos 
recibieron ensayos de prueba en los que se presentaban el tono y la luz aislados. 
Las respuestas dadas durante esas pruebas con los elementos del estímulo se 
compararon entonces con la conducta del sujeto cuando se presentaban simulrá- 
neamente la luz y el tono, como en el entrenamiento de discriminación inicial. 
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Figtra 8.16.—Efectos del tipo de reforzamiento en el control por el estímulo. La respuesta de apretar 

un pedal en palornas fue reforzada en presencia de un escimulo compuesto que consistía en un sonido y 

una luz roja. Con un reforzamiento de comida, la luz conseguía mucho más control sobre la conducta 

que el sonido. Con un reforzamiento de evitación de una descarga, el sonido consiguió más control 
sobre la conducta que la luz. (Según Foree y LoLordo, 1973.) 


En la figura 8.16 se resumen los resultados. Las palomas que recibieron el 
entrenamiento de discriminación con el reforzamiento de comida dieron más res- 
puestas cuando realizaron la prueba con el estímulo luminoso solo que cuando 
realizaron la prueba con el sonido solo. De hecho, la tasa de presión de la palanca 
en respuesta a la presentación aislada de la luz roja fue casi tan alta como cuando 
la luz se presentó simultáneamente con el tono. Podemos llegar a la conclusión de 
que la conducta de esos sujetos estaba casi completamente controlada por el estí- 
mulo de la luz roja. Se produjo un patrón de resultados muy diferente con los 
animales que habían recibido un entrenamiento de discriminación con un refor- 
zamiento de evitación de la descarga. Estos animales daban muchas más respues- 
tas cuando realizaban pruebas con el sonido solo que cuando las realizaban con la 
luz sola. Así pues, con el reforzamiento de evitación de la descarga el sonido 
adquiría un mayor control sobre la respuesta de pedaleo que la luz roja. 

Se han encontrado resultados similares en una gran variedad de experimentos 
(por ejemplo, Foree y LoLordo, 1975; LoLordo y Furrow, 1976; Schindler y 
Weiss, 1982; véase también Shapiro, Jacobs y LoLordo, 1980; Shapiro y LoLordo, 
1982). Esos hallazgos indican que el control por el estímulo sobre la conducta 
instrumental está en parte determinado por el tipo de reforzamiento que se utl- 
lice. Los estímulos visuales parece que tienen más probabilidades de adquirir un 
control sobre la conducta reforzada positivamente que las claves auditivas, y las 
claves auditivas es más probable que adquieran un control de la conducta negati- 
vamente reforzada que las claves visuales. Esta dependencia del control por el 
estímulo respecto al tipo de reforzamiento es probablemente el resultado de la 
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historta evolutiva de las palomas. Las respuestas a claves visuales pueden ser 
particularmente útiles a las palomas cuando están buscando la comida, mientras 
que las respuestas a las claves auditivas pueden ser particularmente adaptativas 
para evitar el peligro. Desgraciadamente es insuficiente nuestro conocimiento de 
la historia evolutiva de las palomas como para ser capaces de identificar las venta- 
jas evolutivas de los diferentes tipos de control por el estímulo en las diferentes 
situaciones. No sabemos tampoco mucho sobre la forma en que en otras especies 
varía el control del estímulo en función del tipo de reforzamiento. Esta cuestión 
es un área fértil para una futura investigación. 


Los efectos del tipo de respuesta instrumental sobre el control por el estímu- 
lo. Otro factor que puede determinar cuál de los diversos componentes de un 
estimulo discriminativo adquiere un control sobre la conducta es la naturaleza de 
la respuesta requerida para obtener el reforzamiento. La importancia de la res- 
puesta instrumental para el control por el estímulo está ilustrada en un experi- 
mento de Dobrzecka, Szwejkowska y Konorski (1966). Estos investigadores estu- 
diaron el aprendizaje de discriminación en perros utilizando estímulos auditivos. 
Los perros estaban sujetos con unos arreos y había un metrónomo colocado 
delante de ellos y un zumbador colocado detrás. El metrónomo y el zumbador 
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Figura 8.17.—Diagrama del experimento de Dobrzecka, Szwejkowska y Konorski (1966). Los perros 
fueron condicionados en una discriminación tzquierda-derecha o acruar-no actuar (grupos 1 y 2, res- 
pectivamente) mediante estímulos auditivos que diferían tanto en su posición (detrás o delante de los 
sujetos) como en su calidad (el sontdo de un zumbador o de un metrónomo). Durante el transcurso de 
la prueba, la posición de los dos sonidos fue intercarmbiada. Los resultados mostraron que la respuesta 
diferencial izquierda-derecha era principalmente controlada por la posición de los sonidos, mientras que 
la respuesta diferencial actuar-no actuar era controlada principalmente por la calidad de los sonidos. 
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suministraban tipos cualitativamente diferentes de sonidos: el metrónomo produ- 
cía un golpe periódico y el zambador producía un zumbido continuo. La localiza- 
ción de las dos fuentes de estírmulos también era diferente, una delante y otra 
detrás del animal. Dobrzecka y otros estaban interesados en cuál de esas dos 
características del estímulo (la cualidad del sonido o su localización) llegaría a 
controlar la conducta. 

Existían en el experimento dos grupos de perros (véase la figura 8.17). Los 
dos grupos diferían en la clase de respuesta que se requería para el reforzamiento 
en presencia de los estímulos del zumbador y del metrónomo. El grupo 1 recibía 
un adiestramiento que podíamos llamar de discriminación derecha-izquierda. 
Cuando sonaba el metrónomo, los sujetos de este grupo eran reforzados por 
levantar la pata derecha; cuando el zumbador sonaba, se les reforzaba por levan- 
tar la pata izquierda. Así, en este grupo, la localización de la respuesta (izquierda- 
derecha) era importante para el reforzamiento. El grupo 2 recibía un adiestra- 
miento en loque podíamos llamar una discriminación de actuar-no actuar. En 
este caso los sujetos aprendían a levantar la pata derecha si oían el zumbador 
(E+), pero a dejarla bajada cuando funcionaba el metrónomo (E —). Así, en ese 
grupo la cualidad de la respuesta (actuar-no actuar) era más importante para el 
reforzamiento que su localización. 

¿Qué aspectos de los sonidos del metrónomo y del zumbador —calidad y 
localización— adquirían un contro! sobre la conducta instrumental en los dos 
grupos de sujetos? Para responder a esta pregunta, Dobrzecka y otros realizaron 
pruebas con animales invirtiendo las posiciones del metrónomo y el zumbador. 
Durante estas pruebas, el zambador se colocó delante de los animales y el metró- 
nomo detrás de ellos (véase figura 8.17). Esta manipulación produjo resultados 
muy diferentes en los dos grupos. Los sujetos entrenados para la discriminación 
izquierda-derecha (en la que la localización de la respuesta fue esencial para el 
reforzamiento) habían aprendido a responder principalmente basándose en la 
localización de las claves auditivas antes que en su calidad. Los sujetos del grupo 1 
levantaban su pata derecha como respuesta al sonido de la parte anterior, inde- 
pendientemente de que el sonido estuviera producido por el zumbador o por el 
metrónomo. Cuando el sonido provenía de la parte trasera, levantaban la pata 
izquierda, de nuevo independientemente de que el sonido hubiera estado produ- 
cido por un metrónomo o por un zumbador. Así pues, la localización de los soni- 
dos controlaba la conducta mucho más que la calidad del sonido. Se observó el 
resultado contrario en los sujetos entremados para la discriminación actuar-no 
actuar. Esos perros respondían sobre todo en base a la calidad del sonido más que 
en base a su localización. Levantaban una pata en respuesta al zumbador, inde- 
pendientemente de que el sonido proviniera de delante o de detrás, y no levanta- 
ban ninguna pata cuando sonaba el metrónomo, de nuevo independientemente de 
la localización de éste. 

Estos resultados indican que es más probable que las respuestas que están 
diferenciadas por la localización (derecha-1zquierda) queden bajo el control de la 
distinta localización de los estímulos discriminativos. Por el contrario, las res- 
puestas que se diferencian por su calidad (actuar-no actuar) tienen más probabili- 
dad de quedar bajo el control de la calidad de los diferentes estímulos dicriminati- 
vos. Actualmente se desconoce por qué existen relaciones así. Sin embargo, los 
resultados indican, claramente, que las actividades requeridas para el reforza- 
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miento pueden determinar qué aspectos de los estímulos discriminativos llegan a 
controlar la conducta instrumental. 


Los efectos de la facilidad relativa de condicionamiento de diversos estímulos. 
Las investigaciones sobre los efectos del tipo de reforzamiento y de respuesta 
instrumental en el control por el estímulo no han sido muy extensas, Por tanto, 
todavía no se conoce la gama de situaciones de discriminación en las que esas 
variables son importantes. Hace tiempo que se conoce otro determinante del con- 
trol por el estímulo: la facilidad relativa de condicionamiento de los diversos 
estímulos de cada situación, y es probable que sea importante en la mayoría de los 
casos de aprendizaje de discriminación del estímulo. Como ya advertimos en el 
capítulo 4, Pavlov (1927) observó que si se presentaban simultáneamente dos 
estímulos, la presencia del estímulo que es más fácil de condicionar impedía el 
condicionamiento del otro estímulo. Este fenómeno se llamó ensombrecimiento. 
La présencia del estímulo que se condiciona rápidamente eclipsa el condiciona- 
miento del otro estímulo. En muchos de los experimentos de Pavlov los dos 
estimulos fueron de la misma modalidad (dos sonidos, por ejemplo), pero dife- 
rían en intensidad. Por lo general, cuanto más intensos eran los estímulos más 
rápidamente se condicionaban. Pavlov halló que un estímulo de baja intensidad 
podía condicionarse (un tanto lentamente) si se presentaba solo y se emparejaba 
repetidamente con el El. Sin embargo, se producía mucho menos condiciona- 
miento si el estímulo débil se presentaba junto con un estímulo más intenso. La 
investigación posterior ha mostrado que puede ocurrir también ensombreci- 
miento entre estímulos de diferentes modalidades, con tal de que un estímulo se 
condicione más fácilmente que el otro (por ejemplo, Kamin, 1969). 

Aunque el fenómeno del ensombrecimiento se descubrió por primera vez en 
el condicionamiento clásico, también se da en los procedimientos de discrímina- 
ción instrumental (para una revisión, véase Sutherland y Mackintosh, 1971). Si 
un estímulo está constiruido por dos componentes, la adquisición del control por 
parte del componente más débil puede ser impedida por la presencia del compo- 
nente más eficaz. Por ejemplo, partiendo de la investigación de LoLordo y sus 
colaboradores esperaríamos que en situaciones de reforzamiento con comida, la 
adquisición del control por un estímulo auditivo fuera ensombrecida por la pre- 
sencia de un estímulo visual. Ya hemos discutido amteriormente los estudios de 
Jenkins y Harrison (1960, 1962) sobre el control por estímulos auditivos del pico- 
teo reforzado con comida en palomas. La tecla de respuesta en esos experimentos 
se iluminaba siempre con una luz blanca, y, a menos que una de las claves audiri- 
vas se utilizara como estímulo discriminativo, la conducta de picoteo no quedaba 
bajo el control de claves auditivas. Este resultado se interpretó como muestra de 
que un estímulo debe ser un E+ para llegar a adquirir control sobre la conducta. 
Sin embargo, un experimento posterior de Rudolph y Van Houten (1977) desafía 
esta conclusión. Encontraron gradientes de generalización empinados que indica- 
ban un fuerte control por parte de las claves auditivas, con tal de que las palomas 
picotearan una tecla oscura. Este hallazgo sugiere que quizá Jenkins y Harrison 
(1960, 1962) no hallaron un control del picoteo por parte de las claves auditivas 
en ausencia de un entrenamiento de discriminación (véase figura 8.8) porque la 
tecla de respuesta que utilizaban se iluminaba con una luz. Quizá la luz ensombre- 
ció el estímulo auditivo durante el entrenamiento. 
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El fenómeno del ensombrecimiento indica que los estímulos pueden, en un 


sentido, competir por adquirir el control sobre la conducta. Dos o más estímulos, 


cada uno de los cuales puede adquirir un control sobre la conducta cuando se 
presentan solos, pueden no controlar la respuesta instrumental cuando se presen- 
tan simultáneamente. Puede impedirse la adquisición del control por estímulos 
poco eficaces mediante la presencia de estímulos más fácilmente condicionables. 
Algunos investigadores creen que la competencia entre los estímulos es el factor 
fundamental que determina el control por el estímulo (véase Mackintosh, 1977). 
Los organismos pueden poseer límites en su capacidad para procesar los diversos 
estímulos, o puede que los reforzadores sólo sean eficaces para reforzar un con- 
junto limitado de estímulos a la vez. En cualquier caso, sólo «los mejores» estímu- 
los de una situación pueden ejercer el control sobre la conducta. El problema. 
consiste en determinar cuáles son los estímulos «mejores» para una circunstancia 
determinada 


EL CONTROL CONDICIONAL POR EL ESTIMULO 
EN EL CONDICIONAMIENTO CLASICO 


Gran parte de nuestra discusión sobre el control por el estímulo en el condi- 
cionamiento instrumental se centra en los procedimientos de discriminación del 


estímulo y en sus efectos. En una reflexión sobre el control por el estímulo resulta 


fundamental considerar la forma en que los organismos aprenden a discriminar 
estímulos, ya que el entrenamiento de discriminación es la más importante 
influencia del aprendizaje sobre el control por el estímulo de la conducta instru- 
mental. En un procedimiento de discriminación, los sujetos son reforzados por 
responder en presencia del E +, pero no son reforzados por responder en presen- 
cia del E—. Así pues, un procedimiento de discriminación consta de tres compo- 
nentes básicos: una clave (E+ o E—), una respuesta y un reforzador. Estos tres 
componentes se disponen de una forma especial, de manera que el primer com- 
ponente (el E+ o el E—,) señala la relación entre el segundo acontecimiento y el 
tercero (la respuesta y el reforzador). Otro modo de considerar este procedi- 
miento es que la relación que existe entre la respuesta y el reforzador depende de, 
o está condicionada a la presencia del E+ o el E—. Existe una relación respuesta: 
reforzador cuando está presente el E+ (reforzamiento positivo) y existe una rela- 
ción diferente cuando está presente el E— (extinción). Así pues, los procedi- 
mientos de discriminación instrumental implican, de hecho, un control condicio- 
nal de la relación entre la respuesta y el reforzador (Jenkins, 1977; Holman y 
Mackintosh, 1981). 

Se ha investigado también el control condicional en el condicionamiento clá- 
sico. El concepto fundamental del control condicional es que un hecho señala la 
relación entre otros dos hechos. Normalmente se considera que el condiciona- 
miento clásico implica una relación entre un estimulo condicionado y un estímulo 
incondicionado. El EC puede ser una breve iluminación con luz naranja de una 
tecla de respuesta, y el El puede ser comida. Existe una relación intensa entre el 
EC y el El si la comida se presenta inmediatamente después de cada aparición del 
EC, pero no en otros momentos. ¿Cómo podríamos establecer un control condi- 
cional sobre ral relación EC-El? 
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Por analogía con los procedimientos de discriminación instrumental, debe- 
ríamos tener un tercer hecho que indicara si la presentación de una tecla ilumi- 
nada concluye con la presentación de comida. Por ejemplo, podríamos utilizar 
como estímulo un ruido, en presencia del cual la iluminación de la tecla iría 
seguida de comida. En ausencia del estímulo del ruido, la iluminación de la tecla 
no daría lugar al El de la comida. En la figura 8.18 se muestra un esquema de este 
procedimiento. Como en los procedimientos de discriminación instrumental, los 
sujetos reciben tanto ensayos reforzados como ensayos no reforzados. Durante los 
ensayos reforzados, el estímulo del ruido funciona durante 15 segundos. Diez 
segundos después de la aparición del ruido, se enciende durante 5 segundos el EC 
de la tecla con una luz naranja, e inmediatamente le sigue el El de la comida. 
Durante los ensayos no reforzados no se presenta el estímulo del ruido. El EC de 
la tecla iluminada durante 5 segundos se enciende solo, sin el El de la comida. 

El procedimiento que acabamos de describir es similar a uno utilizado recien- 
temente por Rescorla, Durlach y Grau (1985) en un experimento de seguimiento 
del signo (automoldeamiento) con palomas. Rescorla y otros utilizaron con la 
mitad de las palomas el estímulo del ruido como clave condicionada en los ensa- 
yos reforzados. Con la otra mitad se utilizó un destello de luz difuso en lugar del 
ruido. La respuesta condicionada que se midió fue el picoteo de la tecla de res- 
puesta cuando se iluminaba con una luz naranja que servía de EC. Ya que el 
picoteo no está provocado por claves visuales o auditivas difusas, la conducta de 
picoteo de la tecla podria interpretarse como una respuesta debida exclusivamente 
al EC de la iluminación naranja de la tecla. 

En la figura 8.19 se ilustran los resultados del experimento. Los sujetos pico- 
teaban la tecla naranja mucho más cuando se presentaba asociada con una clave 
condicional que cuando se presentaba como un elemento aislado. Es decir, la pre- 
sencia de la clave condicional facilitaba las respuestas al EC de la tecla iluminada. 
Es importante recordar que las claves condicionales no provocan por sí solas 
picoteo, porque las palomas no picotean corno respuesta a los estímulos visuales y 
auditivos difusos. Ántes bien, las claves condicionales aumentaban la capacidad 
del EC de la tecla con luz naranja para provocar picoteo. Las clayes condicionales 
difusas habían adquirido un control condicional sobre la capacidad del EC (la luz 
naranja) para provocar la respuesta condicionada. Del mismo modo que un estí- 
mulo discriminativo facilita la conducta instrumental, las claves condicionales 
difusas facilitaban en este estudio las respuestas provocadas por el EC. 

En los procedimientos de discriminación instrumental, las claves condiciona- 
les (E+ y E—) se llaman «estímulos discriminativos». El control condicional de 
las relaciones EC-El en el condicionamiento clásico sólo recientemente se ha con- 


vertido en el objeto de análisis experimentales detallados, y no disponemos de . 


una terminología estándar. Algunos investigadores se han referido a tal control 
condicional como un caso de facilitación porque la clave condicional facilita que 


Eosayos reforzados Ensayos no reforzados Figura 8.18, —Procedimiento para 

AAA AAA establecer control condicional por 

el escímulo en el condicionamien- 

to clásico. En los ensayos refor- 

zados se presenta un estímulo 

de ruido, y una clave huminosa EC es emparejada con comida. En los ensayos no reforzados, el esrí- 
mulo ruidoso está ausente y la clave luminosa EC se presenta sin comida, 


Ruido Sin ruido 
Clave luminosa — comida Clave luminosa — sin comida 
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el EC desencadene la RC (Rescorla, 1985; Rescorla, Durlach y Grau, 1985). 
Siguiendo esta terminología, a la clave condicional se la llama facilitador. Otros 
han preferido llamar presentación de la ocasión al control condicional en el 
condicionamiento clásico porque la clave condicional anuncia las ocasiones en que 
el EC se va a emparejar con el El (Holland, 1985; Ross, 1983; Ross y Holland, 
1981). En esta terminología, a la clave condicional se la llama presentador de la 
ocasión (para las investigaciones sobre presentación de la ocasión en el condicio- 
namiento clásico inhíbitorio, véase Holland, 1985; Rescorla, 1985). 

La facilitación, o presentación de la ocasión, constituye un aspecto importante 
del condicionamiento clásico, no sólo porque ilustra que el condicionamiento clá-. 
sico está sujeto a control condicional, sino también porque parece implicar meca- 
nismos de aprendizaje diferentes a los que hemos considerado hasta ahora. Como 
ya discutimos en el capítulo 4, durante el emparejamiento de un EC con un El los - 
sujetos aprenden una asociación entre los dos hechos tal que la presentación del 
EC llega a activar una representación del El. Nos hemos referido a este tipo de 
aprendizaje como el condicionamiento de excitación al EC. La facilitación es una 
característica aprendida muy diferente de la excitación condicionada. En la facili- 
ración, la clave no activa una representación de otro hecho (el El), sino que activa 
la representación de una relación entre otros dos hechos (un EC y un El. 

El desafío más importante en la investigación sobre facilitación consiste en 
probar en qué aspectos la facilitación difiere de la excitación condicionada, y en 
especificar las circunstancias que llevan a cada tipo de aprendizaje. La evidencia 
sugiere que las dos formas de aprendizaje son distintas, y que provocan efectos 
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distintos sobre la conducta aun en el caso de que el mismo estímulo se condicione 
como facilitador o como excitador condicionado (para revisiones recientes véase 
Holland, 1985; Rescorla, 1985). Una de las diferencias más interesantes entre 
facilitación y excitación condicionada aparece al observar los efectos de un proce- 
dimiento de extinción. Como ya advertimos en el capítulo 3, un estímulo excitato- 
rio condicionado que se presenta solo repetidamente pierde gradualmente la 
capacidad de provocar la respuesta condicionada: experimenta extinción. No sur- 
te efecto el mismo procedimiento aplicado a un facilirador. Una vez establecido 
un estímulo como clave condicional que señala la relación EC-El, las presentacio- 
nes repetidas del estimulo solo no reducen su capacidad de facilitar las respuestas 
condicionadas al EC. 

La diferencia en los efectos de la extinción sobre los estímulos excitatorios 
condicionados y sobre los facilitadores puede tener relación con lo que ambos 
señalan. Un estímulo excitatorio condicionado señala la futura presentación del 
El. La ausencia del El durante la extinción es una violación de la expectativa 
condicionada al EC. Por tanto, el valor de señal del EC tiene que reajustarse en la 
extinción para que esté de acuerdo con la nueva realidad. No se necesita ese 
reajuste en un procedimiento de extinción de un estímulo facilitador. Un facilita- 
dor señala una relación entre dos hechos (un EC y un El). La ausencia de estos 
hechos durante la extinción no significa que haya cambiado la relación entre ellos. 
Los estímulos (o falta de estímulos) presentes durante la extinción no indican que 
la información señalada por un facilitador sea incorrecta. Por tanto, durante la 
extinción permanece intacta la capacidad del facilitador para promovéase las res- 
puestas provocadas por otro EC. Estas consideraciones sugieren que el efecto faci- 
litador de un estímulo condicional se altera sólo si se altera la relación EC-El 
señalada por el facilitador. La investigación sobre este tema y otros relacionados 
con él suministrará sin duda nuevos conocimientos acerca de los diversos meca- 
nismos que sitúan la conducta bajo el control de los estímulos, 


EL CONTROL POR EL ESTIMULO FUERA DEL LABORATORIO 


El autocontrol 


La mayoría de las personas experimentan en algún momento de su vida pro- 
blemas de autocontrol. Los estudiantes que desean mejorar sus notas tienen difi- 
cultades para mejorar sus hábitos de estudio; los fumadores que quieren abando- 
nar el tabaco no pueden resistirse a un cigarro; las personas que quieren adelgazar 
tienen dificultades para controlar la ingestión de comida. En los problemas de 
autocontrol intervienen, a menudo, conductas que surgen en momentos y lugares 
inapropiados, y que interfieren con objetivos a largo plazo. Los terapeutas de la 
conducta, para ayudar a las personas a mejorar su autocontrol han sugerido técni- 
cas que limitan el control que varios estímulos poseen sobre ciertas conductas 
(para un examen del problema, véase Fox, 1966). Algunas sugerencias para mejo- 
rar los hábitos de estudio son las siguientes: 

1. Seleccionar un lugar adecuado para estudiar, con iluminación adecuada y 
libre de. distracciones. 

2, Estudiar en ese lugar y sólo en ese lugar. (No estudiar en la cama pues 
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esto lleva probablemente a dormir antes que a estudiar.) No utilizar el área de 
estudio para otras tareas, tales como escribir cartas o dibujar. 

3. Permanecer en el área de estudio sólo durante el tiempo que estamos 
estudiando. Si nos empezamos a distraer, nos tenemos que disponer a abandonar 
el área de estudio. 

4. Antes de abandonar de hecho el área, completar una pequeña unidad de 
trabajo. Terminar de leer la página o completar un problema. 

El objetivo de estas sugerencias es establecer el lugar de estudio como un 
estímulo discriminativo para el estudio concentrado, en oposición a otras conduc- 
tas, tales como escribir una carta, dibujar o charlar. Como ocurre con muchas 
aplicaciones, los principios de laboratorio se aplican aquí sólo de forma aproxi- 
mada; se puede observar que no funciona ninguna contingencia diferencial verda- 
dera: al estudiante no se le obliga realmente. La esperanza consiste, sin embargo, 
en que, al limitar la conducta que se puede realizar en el espacio de estudio, esta 
situación estimular llegará a controlar la conducta de estudio. De hecho, muchos - 
estudiantes encuentran estas sugerencias bastante útiles. 

Se ha seguido un enfoque similar en los programas de adelgazamiento. Los 
programas de adelgazamiento se esfuerzan por reducir la ingestión de calorías a 
través de la dieta y aumentar el gasto calórico por medio del ejercicio físico. 
Muchos programas de adelgazamiento incluyen ahora igualmente un componente 
conductual. La investigación ha mostrado que alterar las condiciones bajo las cua- 
les las personas comen, ayuda a alterar la cantidad ingerida (véase Stunkard y 
Mahoney, 1976). Esto sucede porque el comer está provocado frecuentemente por 
estímulos, aun cuando no existe una necesidad real de comida. Comer puede ser 
provocado por cosas tales como la hora del día, la presencia de comida ya prepa- 
rada, encender la televisión o sentarse a hablar con un amigo. Los programas de 
adelgazamiento tratan de contrarrestar los efectos de esos estímulos pidiendo a 
los participantes que coman sólo en determinados lugares. Á la persona que va a 
seguir la dieta se le enseña, por ejemplo, a comer sólo en una mesa concreta 
puesta de un modo adecuado. Las condiciones estimulares pueden hacerse suma- 
mente específicas utilizando sólo un mantel y una vajilla concreta. Además, sólo 
se come la comida que se prepara y se sirve de forma adecuada, Debemos repetir 
aquí que estas sugerencias constituyen sólo una parte de un programa completo 
de adelgazamiento. No son suficientes por sí mismas. Son muy útiles en muchos 
casos porque con frecuencia es más fácil limitar el lugar donde se come que la 
cantidad de comida que se come. Por otra parte, al restringir los lugares donde 
comemos se reduce con frecuencia también la cantidad de comida que tomamos. 
El lector interesado puede consultar para más detalles un plan de enorme éxito 
propuesto por Stuart y Davis (1972) en un libro titulado Sim Chance im a Fat 
World (Una pequeña oportunidad para el mundo de los gordos). 


Las imteracciones sociales 


En nuestras interacciones sociales diarias suministramos y utilizamos muchas 
claves que pueden ser descritas como estímulos discriminativos. Las expresiones 
faciales, por ejemplo, pueden hacer de claves discriminativas poderosas. Los niños 
en seguida reconocen «esa mirada» de su madre que significa «como sigas 
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haciendo eso verás lo que te va a pasar». Si nos encontramos a un amigo que 
sonríe y anda animadamente, es probable que tendamos a saludarle con amabili- 
dad. Es muy probable que nuestras manifestaciones sociales se vean reforzadas. 
Probablemente ocurrirá lo contrario si la persona anda con el ceño fruncido y 
cabizbajo. 

Las diferentes posturas corporales invitan también a respuestas características 
de los demás. Algunas posturas se describen como provocativas, que invitan a 
avances sexuales. La investigación sobre posturas corporales y orientación ha 
mostrado que el «lenguaje del cuerpo» puede facilitar una considerable informa- 
ción. Por ejemplo, cuando se da una interacción de simpatía, las personas tienden 
a permanecer más cerca unas de otras, con el cuerpo y la cabeza de frente (por 
ejemplo, Mehrabian, 1970; Mebrabian y Weiner, 1966). 

En un interesante estudio, Murphy y Levine (1982) analizaron las posturas 
corporales de chicos de los que abusaban sus compañeros. Cuando se intenta ali- 
viar este tipo de abusos, los profesores y los padres tratan, normalmente, de 
cambiar la conducta del autor antes que la de la víctima. Los resultados de este 
estudio sugieren que la víctima puede ser un objetivo mejor sobre el que interve- 
nir. Los investigadores tomaron en vídeo la forma de colocarse en pequeños gru- 
pos los niños que resultaban ser víctimas de sus compañeros. Esos niños mante- 
nían una distancia mayor respecto a los otros miembros del grupo que los niños 
que no eran víctimas, y orientaban con frecuencia el cuerpo y la cabeza hacia el 
lado contrario del grupo. Estas acciones y las orientaciones corporales pueden ser 
señales (estímulos discriminativos) que provocan el ser escogidos como víctimas. 
Acercar a las víctimas infantiles a sus compañeros, y conseguir que realicen 
movimientos corporales y orientaciones más indicativas de una participación en 
el grupo, puede ayudar a que esos niños sean más aceptados por sus compa- 
ñeros. 

A veces los estímulos discriminativos sociales los proporciona el rol que un 
individuo tiene en la sociedad. Los policías, los profesores y los padres sirven de 
estímulos discriminativos que señalan que ciertas respuestas van a ser reforzadas 
o castigadas. Encontrarnos con la policía cuando vamos conduciendo por una 
autopista nos hace comprobar el marcador de velocidad y si no, tener más cuidado 
en seguir las reglas de la circulación. Cualquier niño de la escuela elemental sabe 
de qué forma la presencia o ausencia del profesor en el aula determina el nivel de 
travesuras en la clase. De forma similar, la presencia o ausencia de un padre 
puede alterar la probabilidad de conducta revoltosa del hijo.  * 

El control por el estímulo, o la falta de él, crea a menudo problemas en las 
relaciones padre-hijo. A los padres les gustaría que sus hijos les respetaran siendo 
razonablemente obedientes. Podríamos asegurar la obediencia en la mayoría de 
los niños administrando siempre castigos severos por las trasgresiones, o refor- 
zando la obediencia con recompensas extraordinarias. Sin embargo, pocos padres 
desean tener un trato con sus hijos tan autoritario. Los padres son inconstantes. 
Muchas veces, sus palabras no anuncian la verdadera relación entre la conducta y 
sus consecuencias. Por tanto, sus palabras no siempre hacen de estímulos discri- 
minativos como a ellos les gustaría. Por ejemplo, la madre dice: «Juan, si vuelves 
a pegar a tu hermana, no ves la televisión hoy.» Juan le vuelve a pegar a su 
hermana y se le impide véase la televisión. Sin embargo, a las 4 p.m. la madre ya 
está cansada de que Juan ande por en medio todo el día y llevada por la desespe- 
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e.” 


ración lo coloca frente al televisor. Si las cosas suceden así no es de extrañar que 
Juan no sea obediente. o a 

A veces los problemas en las interacciones padres-hijos pueden entenderse en 
función de la naturaleza aversiva de las señales para el no reforzamiento (los 
E—). Algunos niños, por la razón que sea, son más difíciles de manejar que 
otros. La sola presencia de esos niños puede hacer de E— para sus padres. La 
presencia de un niño hiperactivo puede indicar a su padre que sus esfuerzos por 
mantener la paz y armonía en la casa no van a ser recompensados. En familias 
con casos de malos tratos, es más probable que los abusos se centren en los niños 
hiperactivos, o que son considerados por sus padres como difíciles y hostiles, que 
en sus hermanos (véase, por ejemplo, Kempe y Kempe, 1978). Este hallazgo se 
corresponde con la evidencia experimental de que un E— puede resultar aversivo , 
y provocar agresión. | Ñ 

Muchos padres de niños hiperactivos, aun no siendo padres que regañan, 
informan que se sienten enfadados con su hijo. En el grupo de padres del a 
informan Levine y Sandeen (1985) el enfado constituyó el tema de la terapia. E 
objetivo principal del programa llevado a cabo con el grupo fue enseñar a los 
padres modos mejores de manejar a sus hijos, pero después de dos sesiones nin- 
guno informó de que hubiera existido progreso alguno. Se descubrió que los 
padres simplemente estaban demasiado enfadados por la mera presencia del niño 
como para intentar nada nuevo. Se realizó una desensibilización hacia las malas 
conductas de los niños. El último paso en la jerarquía de la desensibilización 
consistió en entrenar a los padres para que permanecieran relajados mientras 
imaginaban a su hijo mordiéndoles las piernas cuando estaban sirviendo café al 
cura de su parroquia. Después de esta desensibilización los padres fueron capaces 
de trabajar con sus hijos con mucho más éxito. 
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Capítulo 9 
CONTROL AVERSIVO: LA EVITACION Y EL CASTIGO 


En el presente capítulo vamos a discutir cómo puede ser controlada la con- 
ducta mediante la estimulación aversiva. Nos limitaremos a presentar dos tipos 
de control aversivo instrumental: la evitación y el castigo. El condicionamiento de 
evitación aumenta el rendimiento de la conducta en cuestión mientras que el 
castigo la disminuye. Sin embargo, en ambos casos los sujetos aprenden a mini- 
mizar su exposición a la estimulación aversiva. Debido a esta semejanza, los aná- 
lisis teóricos de la evitación y el castigo tienen algunos conceptos en común. Sin 
embargo, el análisis experimental de los dos tipos de condicionamiento se ha 
desarrollado de forma totalmente independiente uno de otro. Vamos a describir 
los retos teóricos y hallazgos empíricos fundamentales en las dos áreas de 
investigación. 


LA CONDUCTA DE EVITACION 
Los orígenes del estudio de la conducta de evitación 
El procedimiento de evitación discriminada 
La teoría de la evitación de los dos procesos 
El análisis experimental de la conducta de evitación 
Experimentos sobre el impulso adquirido 
Medida independiente del miedo durante la adquisición de la conducta de 
evitación 
Ejecución de la evitación en asíntota 
La extinción de la conducta de evitación mediante el bloqueo de la res- 
puesta y la exposición al EC solo 
La evitación no discriminada (de operante libre) 
Explicaciones teóricas alternativas de la conducta de evitación 
El reforzamiento positivo mediante la inhibición condicionada del miedo 
El reforzamiento de la evitación mediante la reducción de la frecuencia 
de descarga 
La conducta de evitación y las reacciones de defensa específicas de la 
especie 
La hipótesis del estímulo comsumatorio como recompensa 
El problema de la evitación: comentarios finales 
EL CASTIGO 
Análisis experimental del castigo 
Las características del estímulo aversivo y su método de introducción 
La estimulación aversiva contingente a la respuesta frente a la indepen- 
diente de la respuesta 


Los efectos de la demora en el castigo 
Los efectos de los programas de castigo 
Los efectos de los programas de reforzamiento positivo 


La disponibilidad de las respuestas alternativas para obtener reforza- 


miento positivo 
Los efectos de un estímulo discriminativo para el castigo 


El castigo como señal para la disponibilidad de reforzamiento positivo 


Otros ejemplos de conducta autopunitiva 


Las limitaciones de la respuesta para la eficacia del castigo 


El castigo y la redistribución de la respuesta 
Teorías del castigo 
Teoría del castigo de la respuesta emocional condicionada 
Teoría del castigo como evitación 
El castigo y la ley del efecto negativo 
El uso del castigo fuera del laboratorio 
Problemas prácticos en el uso del castigo 
Consideraciones morales 
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LA CONDUCTA DE EVITACION 


La evitación es un tipo de conducta instrumental en la que las respuestas del 
organismo impiden la aparición de un estímulo aversivo. Una conducta de evita- 
ción eficaz es esencial para la supervivencia. Los animales tienen que evitar a los 
predadores y la exposición a condiciones climáticas extremas, al igual que a cosas 
más triviales, como dormirse, caerse o tropezar con los objetos. La evitación cons- 
tituye también una parte importante de la conducta humana. Agarrarnos a un 
pasamanos cuando vamos andando por una superficie irregular nos ayuda a evitar 
una caída, poner las manos delante de nosotros cuando vamos andando por una 
habitación oscura nos ayuda a evitar tropezar con las cosas, realizar ajustes con el 
volante cuando vamos conduciendo nos ayuda a evitar salirnos de la carretera. 
Esas y otras numerosas actividades constituyen una conducta de evitación porque 
en cada caso la respuesta instrumental es la responsable de prevenir una situación 
aversiva que de otro modo hubiera ocurrido. 

En la mayoría de los casos la respuesta de evitación va seguida únicamente de 
la ausencia de un hecho aversivo. Si damos las respuestas de evitación apropiadas, 
no nos caeremos, no tropezaremos, no nos saldremos de la carretera. De esas 
experiencias no se deriva ningún placer en particular. Simplemente no nos hace- 
mos daño. 

La ausencia de una situación aversiva es, presumiblemente, la razón por la que 
se dan respuestas de evitación. Sin embargo, ¿cómo puede la ausencia de algo 
proporcionar reforzamiento a la conducta instrumental? Esta es la cuestión fun- 
damental en el estudio de la evitación. Mowrer y Lamoreaux (1942, pág. 6) seña- 
laron hace algunos años que «la no obtención de algo difícilmente puede clasifi- 
carse en sí de reforzamiento». Desde entonces, se ha dedicado mucho esfuerzo a 
imaginar qué más hay implicado en los procedimientos de condicionamiento de 
evitación que podría suministrar un reforzamiento a la conducta. De hecho, la 


investigación de la conducta de evitación ha estado dominada por este problema 
Pee 
teórico. 


Los orígenes del estudio de la conducta de evitación 


El estudio de la conducta de evitación en un principio se unió estrechamente a 
las investigaciones sobre condicionamiento clásico. Los primeros experimentos de 
condicionamiento de evitación fueron llevados a cabo por el psicólogo ruso Bech- 
terev (1913) como ampliación de las investigaciones de Pavlov. Sin embargo, a 
diferencia de Pavlov, Bechterev investigó los mecanismos de condicionamiento en 
los sujetos humanos. En una de las situaciones se pidió a los participantes que 
introdujeran el dedo en un recipiente de metal. Se presentaba periódicamente un 
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estímulo de aviso (el EC), seguido de una descarga eléctrica breve (el El) a través 
del recipiente. Como posiblemente sospecharán, los sujetos sacaban rápidamente 
el dedo del recipiente al recibir la descarga. Tras los ensayos repetidos de condi- 
cionamiento, también aprendían a dar esta respuesta ante el estímulo de aviso. El 
experimento se consideró como un modelo estándar de condicionamiento clásico. 
Sin embargo, en contraposición al procedimiento estándar de condicionamiento 
clásico, en el método de Bechterev los sujetos determinaban si iban a ser expues- 
tos al El. Si sacaban el dedo del plato en respuesta al EC, no experimentaban la 
descarga programada en ese ensayo. Este aspecto del procedimiento constituye 
una desviación significativa del método de Pavlov, porque en el condicionamiento 
clásico estándar la presentación del El no depende de la conducta del sujeto. 
Durante muchos años pasó desapercibido el hecho de que Bechterev y otros 
que siguieron su ejemplo no habían utilizado el procedimiento de condiciona- 
miento clásico estándar. A principios de los años 30, varios investigadores inten- 
taron comparar directamente los efectos de un procedimiento de condiciona- 
miento clásico estándar con los efectos de un procedimiento que tenía el 
componente añadido de la evitación instrumental (por ejemplo, Schlosberg, 1934, 
1936). Una de las comparaciones más influyentes la realizaron Brogden, Lipman 
y Culler (1938). Colocaron dos grupos de cobayas en un aparato de rueda giratoria 
(véase figura 9.1). Un sonido hacía de EC, y, de nuevo, una descarga hacía de El. 
La descarga estimulaba la carrera de las cobayas y de este modo giraba la rueda. 
En un grupo de sujetos, la descarga se presentaba siempre 2 segundos después del 
comienzo del sonido (grupo clásico). El segundo grupo (grupo de evitación) reci- 
bía el mismo tipo de emparejamiento EC-El cuando no daban la respuesta condi- 
cionada (un movimiento pequeño de la rueda). Sin embargo, si esos sujetos 
movían la rueda durante el EC auditivo antes de que se produjera la descarga, la 
descarga programada se omitía, La fígura 9,2 muestra el porcentaje de ensayos en 
los que cada grupo daba la respuesta condicionada. Es evidente, a partir de los 
resultados, que el grupo de evitación aprendía rápidamente a dar la respuesta 
condicionada, y respondió el 100 por 100 de los ensayos antes de ocho días de 
entrenamiento. Por el contrario, el grupo clásico nunca consiguió este alto nivel 
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de rendimiento, aun cuando el entrenamiento con ellos continuaba por mucho 
más tiempo. 

Estos resultados muestran una gran diferencia entre el condicionamiento clá- 
sico estándar y un procedimiento que incluya un componente de evitación ¡ns- 
trumental. El procedimiento de evitación produjo un nivel mucho más alto de 
respuestas que las observadas con el mero emparejamiento del EC. y la descarga. 
Esta facilitación de la conducta no puede explicarse solamente a través de lo que 
se conoce del condicionamiento clásico. De hecho, los resultados obtenidos por 
Brogden y otros resultan paradójicos cuando se consideran en términos de condi- 
cionamiento clásico. En el grupo de evitación, el EC se presentaba a menudo sin 
el El porque los sujetos impedían con frecuencia la presentación de la descarga. 
Esos ensayos con el EC sólo constituyen ensayos de extinción y, por tanto, debe- 
rían haber atenuado el desarrollo de la respuesta condicionada. Por el contrario, el 
grupo clásico nunca recibía los ensayos de EC aislado porque nunca podían evitar 
la descarga. Así pues, si el emparejamiento del EC-El fuera el único factor impor- 
tante en esta situación, el grupo clásico debería haber tenido un rendimiento 
mejor que el grupo de eviración. El hecho de que se diera el resultado contrario 
indica que el análisis de la conducta de evitación precisa de algo más que los 
principios del condicionamiento clásico. 


El procedimiento de evitación discriminada 


Aunque la conducta de evitación no es simplemente un caso más de condicio- 
namiento clásico, la herencia del condicionamiento clásico en el estudio de la 
conducta de evitación ha tenido una gran influencia en los análisis experimentales 
y teóricos posteriores. Los investigadores han sentido un gran interés por la 
importancia de las claves que señalan el acontecimiento aversivo en el condicio- 
namiento de evitación, y por la relación de la señal de aviso con la respuesta 
instrumental y el EC aversivo. Este tipo de cuestiones experimentales han sido 
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Figura 9.3.—Diagrama del procedimiento discriminado, o señalizado, de evitación. Ensayo de evita- 

ción: Si el sujeto ejecuta la respuesta requerida para la evitación durante el EC (la señal) pero antes de 

que el El (por ejemplo, una descarga) sea realizado, el EC se desconecta, y el El es omitido en ese 

ensayo. Ensayo de escape: Si el sujeto no logra realizar la respuesta requerida durante el intervalo 

EC-El, se presenta la descarga programada, que permanecerá hasta que aparezca la respuesta, la cual 
hará desaparecer tanto al EC como al El 


extensamente investigadas con procedimientos similares al utilizado por Brogden 
y sus colaboradores. Este método se llama de evitación discriminada o señalada, 
y sus características estándar se muestran en el esquema de la figura 9.3. 

El primer punto a tener en cuenta sobre la técnica de evitación señalada es 
que incluye ensayos discretos. Cada ensayo se inicia con el EC. Los hechos que 
tienen lugar después dependen de lo que haga el sujeto. Existen dos posibilidades. 
Si el sujeto da la respuesta requerida para la evitación durante el EC, pero antes 
de que se programe la descarga, el EC cesa y el El se ornite en ese ensayo. Este es 
un ensayo de evitación con éxito. Si el sujeto no da la respuesta requerida 
durante el intervalo EC-El, se presenta la descarga programada y se mantiene 
hasta que se produce la respuesta, después de lo cual tanto el EC como el El cesan. 
En este caso, la respuesta instrumental produce el escape de la descarga eléctrica. 
Por tanto, este tipo de ensayo se llama ensayo de escape. Durante los primeros 
estadios del entrenamiento, la mayoría de los ensayos son ensayos de escape, 
mientras que predominan los ensayos de evitación una vez que se establece la 
respuesta de evitación. 

Se pueden llevar a cabo procedimientos de evitación discriminada utilizando 
una gran variedad de situaciones experimentales. Podemos, por ejemplo, utilizar 
una caja de Skinner en la que una rata tiene que presionar una palanca de res- 
puesta mientras suena un tono para evitar la descarga (Hoffman, 1966). Otra 
situación experimental que se ha utilizado extensamente en los estudios de evita- 


ción discriminada es la caja lanzadera, un ejemplo de la cual se muestra en la 


figura 9.4. La caja lanzadera consiste en dos compartimentos separados por una 
barrera baja y una puerta que se desliza en dirección vertical. El animal se coloca 
en un lado. Al comienzo del ensayo se presenta el EC (una luz o un sonido, por 
ejemplo) y se abre la puerta que hay entre los dos compartimentos. Si el animal 
cruza al otro lado antes de que se programe la descarga, ésta no se efectúa, y la 
puerta se cierra hasta el ensayo siguiente. Cuando se inicia el siguiente ensayo el 
animal sigue en el segundo compartimento. Con este procedimiento, el animal se 
lanza de un lado al otro en los sucesivos ensayos. La respuesta se llama, por tanto, 
evitación de lanzadera. 

En el procedimiento de evitación de lanzadera, el animal puede recibir una 
descarga en cualquier lado del aparato. Por ejemplo, si el sujeto está en el lado 
izquierdo cuando comienza el ensayo, y no da la respuesta de cruzar de un lado al 
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Figura 9.4.—Caja lanzadera. La 
caja tiene un suelo enrejado de 
metal, y está separada en dos 
compartimentos por una barrera 
baja y una puerta en guillotina. 
Esta puerta es elevada al comien- 
zo de cada ensayo. La respuesta 
instrumental consiste en cruzar 
de un lado a otro de la caja. 








otro, recibe la descarga allí. Si está en el lado derecho cuando comienza un ensayo 
y de nuevo no cruza, recibe la descarga en el lado derecho. Una modalidad del 
procedimiento de evitación de lanzadera que se ha investigado también extensa- 
mente es que el sujeto se coloque siempre en el mismo lado de la caja de lanza- 
dera al comienzo del ensayo. Por ejemplo, puede colocarse siempre en el compar- 
timento izquierdo, En ese caso, el animal tendría que correr al compartimento 
derecho en cada ensayo para evitar (o escapar de) la descarga. Al final del ensayo 
se le sacaría del compartimento derecho y se le volvería a colocar en el izquierdo 
para empezar el ensayo siguiente. Este procedimiento se llama procedimiento de 
evitación de dirección única porque el animal siempre tiene que cruzar en la 
misma dirección. Un aspecto importante del procedimiento de dirección única es 
Que el animal puede recibir la descarga sólo en uno de los dos compartimentos. 
(en el que se le coloca al comienzo del ensayo). Este lado del aparato se llama 
compartimento de la descarga, y el otro lado se llama compartimento de segu- 
ridad. Dado que en los procedimientos de evitación de dirección única existe un 
compartimento seguro constante, la conducta de evitación de dirección única se 
aprende normalmente más rápidamente que la conducta de lanzadera. 


La teoría de la evitación de los dos procesos 


Resulta evidente a partir de los resultados de experimentos tales como los de 
Brogden y otros (1938) que los procedimientos de evitación producen muchas 
más respuestas que los procedimientos en los que se empareja repetidamente una 
señal de aviso con la descarga, pero en los que no es posible la evitación. La 
contingencia con la evitación proporciona algún tipo de reforzamiento instru- 
mental a la respuesta de evitación. La cuestión central en las investigaciones sobre 
aprendizaje de evitación ha sido cuál es exactamente la fuente de reforzamiento. 
La primera y más influyente respuesta al problema, propuesta por Mowrer 
(1947) y elaborada por Miller (1951) y colaboradores, es conocida como la teoría 
de la evitación de los dos procesos. Por unas u otras razones, esta teoría de los 
dos procesos ha sido muchos años la concepción teórica dominante en el a prendi- 
zaje de evitación. Como ya veremos, la teoría tiene algunas deficiencias serias, y 
ya no se considera una explicación completa del aprendizaje de evitación. Sin 
embargo, sigue siendo importante, al menos en el sentido de que es la explicación 
estándar contra la que se miden siempre todas las otras explicaciones. 

Como su nombre indica, la teoría de los dos procesos sostiene que en el 
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aprendizaje de evitación están implicados dos procesos. El primero es un proceso 
de condicionamiento clásico activado por el emparejamiento del estímulo de aviso 
(EC) con el acontecimiento aversivo (El) en los ensayos en que los sujetos no dan 
la respuesta de evitación. Como era corriente entonces, Mowrer consideraba que 
el condicionamiento clásico ocurre por sustitución del estímulo. Dado que el El 
era un hecho aversivo, Mowrer suponía que provocaba miedo. Á través del condi- 
cionamiento clásico con el El, el EC presumiblemente llega también a provocar 
miedo. Así, el primer componente de la teoría de los dos procesos es el condicio- 
namiento clásico de miedo al EC. 

El miedo es un estado de activación emocional que motiva al organismo. Es 
también aversivo, de forma que una reducción del miedo puede proporcionar un 
reforzamiento negativo. Ya que el miedo está provocado por el EC, la interrup- 
ción del EC presumiblemente da como resultado una reducción del nivel de 
miedo. El segundo proceso en la teoría de los dos procesos se basa en estas consi- 
deraciones. Mowrer sostenía que la respuesta de evitación instrumental se 
aprende porque interrumpe el EC y de este modo reduce el miedo condicionado 
provocado por el EC. Así, el segundo componente es un reforzamiento instru- 
mental de la respuesta de evitación a través de la reducción del miedo. 

Existen varios aspectos a tener en cuenta en la teoría de los dos procesos. El 
primero, y quizás el más importante, es que sostiene que los procesos instrumen- 
tal y clásico no proporcionan a la conducta de evitación unas fuentes de apoyo 
independientes. Antes bien, los dos procesos son muy interdependientes. El 
reforzamiento instrumental mediante la reducción del miedo no es posible hasta 
que el miedo se condiciona al EC, Por tanto, el proceso de condicionamiento 
clásico tiene que ocurrir primero. Después de esto, el proceso de condiciona- 
miento instrumental ya puede iniciar los ensayos de extinción del proceso de 
condicionamiento clásico. Esto se produce porque cada respuesta de evitación que 
se realiza impide la aparición del El. Así pues, la teoría de los dos procesos 
predice una interacción constante entre los procesos clásico e instrumental. Otro 
aspecto importante de la teoría de los dos procesos es que explica la conducta de 
evitación en términos de escape del miedo condicionado, más que en términos de 
prevención de la descarga. El hecho de que la respuesta de evitación impida la 
descarga se ve como un fenómeno secundario en la teoría de los dos procesos, no 
como el hecho esencial que motiva la conducta de evitación. El escape del miedo 
condicionado proporciona el reforzamiento esencial a la conducta de evitación. 
Así pues, de acuerdo con la teoría de los dos procesos, la respuesta instrumental 
se refuerza con un hecho tangible (la reducción del miedo) más que con la mera 
ausencia de algo (la estimulación aversiva). 


El análisis experimental de la conducta de evitación 


En relación con la conducta de evitación se han llevado a cabo gran cantidad 
de investigaciones, muchas de ellas estimuladas de un modo u otro por la teoría 
de los dos procesos. No podemos revisar todos los datos en ellas obtenidos. Sin 
embargo, vamos a considerar algunos resultados importantes que deben tenerse 
en cuenta en cualquier esfuerzo para un total entendimiento de los mecanismos 
de la conducta de evitación. 
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Experimentos sobre el impulso adquirido. En el experimento característico 
de evitación, el condicionamiento clásico del miedo y el reforzamiento instrumen- 
tal a través de la reducción del miedo se entremezclan en una serie de ensayos. 
Sin embargo, si esos dos procesos contribuyen de forma separada al aprendizaje 
de evitación, sería posible demostrar su funcionamiento en situaciones en las que 
los dos tipos de condicionamiento no se entremezclan. Ese es el objetivo de los 
experimentos del impulso adquirido, La estrategia básica es condicionar primero 
el miedo al EC con un procedimiento de condicionamiento clásico «puro» en el 
que las respuestas del organismo no influyan en la presentación o no del El. En la 
fase siguiente del experimento, los animales fueron expuestos periódicamente al 
EC provocador de miedo y se les permitió que ejecutaran una respuesta instru- 
mental que fuera efectiva para terminar el EC (y, por tanto, reducir el miedo). En 
esa fase no se programó ninguna descarga. Por tanto, la respuesta instrumental 
no servía para evitar las presentaciones de la descarga. Si la teoría de los dos 
procesos es correcta y escapar del EC provocador de miedo puede reforzar la 
respuesta instrumental, entonces los sujetos deberían de ser capaces de aprender 
la respuesta instrumental en la segunda fase de! experimento. Este tipo de expe- 
rimento se llama estudio del impulso adquirido porque el impulso para ejecutar 
la respuesta instrumental (el miedo) se aprende a través del condicionamiento 
clásico. (No es un impulso innato, como el hambre o la sed.) 

Uno de los primeros y más famosos experimentos sobre el impulso adquirido 
fue realizado por Miller (1948). Sin embargo, debido a ciertos problemas con ese 
estudio vamos a describir un experimento posterior de Brown y Jacobs (1949). Se 
sometió a unas ratas a pruebas en una caja lanzadera. Durante la primera fase del 
procedimiento, la puerta entre los dos compartimentos de la caja estaba cerrada. 
Las ratas fueron colocadas de una en una en un lado del aparato, y se presentaba 
como EC una luz intermitente y un sonido, que terminaban con una descarga 
eléctrica a través de un suelo enrejado metálico. Se llevaron a cabo veintidós de 
estos ensayos de condicionamiento pavloviano, con las ratas confinadas en los 
lados izquierdo y derecho del aparato en ensayos alternos. El grupo de control 
recibió el mismo entrenamiento, excepto que no se administraba ninguna des- 
carga. Durante la fase siguiente del experimento se colocó a cada sujeto en un 
lado de la caja lanzadera y se quitó la barrera central. El EC se presentó a conti- 
nuación y se mantuvo hasta que el sujeto lo apagaba cruzando al otro lado. Enton- 
ces se sacaba al animal del aparato hasta el siguiente ensayo. Durante esta fase del 
experimento no se administraba ninguna descarga, y se utilizaba un procedi- 
miento de dirección única, con los animales colocados siempre en el mismo lado 
del aparato al comienzo de cada ensayo. Los investigadores estaban interesados en 
ver si las ratas aprendían a cruzar rápidamente de un lado af otro cuando el único 
reforzamiento por cruzar era la terminación del EC del tono o de la luz previa- 
mente condicionado. 

Se midió la cantidad de tiempo que tarda cada sujeto en cruzar la caja lanza- 
dera y así apagar el EC en cada ensayo. La figura 9.5 resume las latencias de 
respuesta en el grupo condicionado a la descarga y en el de control. Los dos 
grupos tenían latencias de respuesta similares al principio del entrenamiento ins- 
trumental, Sin embargo, conforme el entrenamiento avanzaba, los animales con- 
dicionados a la descarga aprendían a cruzar la caja lanzadera más deprisa (y, por 
tanto, apagaban el EC más deprisa) que el grupo de control, Este resultado mues- 
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Figura 9.5.—Latencias medias 
del grupo experimental y del gra- 
po de control para pasar de un 
lado a otro de la caja lanzadera. 
Cruzar de un lado a otro provo- 
caba la terminación del EC du- 
rante ese ensayo. En el grupo 
experimental, el EC fue previa- 
mente condicionado con una des- 
carga. Tal condicionamiento no 
se daba en el grupo de control. 
(Según Brown y Jacobs, 1949.) 
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tra que la terminación de un estímulo condicionado de miedo es suficiente para 
proporcionar reforzamiento a la respuesta instrumental, Se han obtenido estos 
mismos hallazgos con una gran variedad de situaciones experimentales (por 
ejemplo, Dinsmoor, 1962; McAllister y McAllister, 1971). Además, os per 
mentos han mostrado que si se retrasa la terminación del EC una vez realizada la 
respuesta instrumental, se reduce el efecto del reforzamiento, exactamente como 
ocurre con las respuestas instrumentales mantenidas con reforzamiento positivo 
(por ejemplo, Delprato, 1969; Israel, Devine, O'Dea y Hamadi, 1974; Karzev, 
1967, 1972). Estos resultados ofrecen un fuerte soporte a la teoría de los dos 
procesos. 


Medida independiente del miedo durante la adquisición de la conducta de de 
tación. Otra estrategia importante que se ha utilizado en las investigaciones de 
la conducta de evitación implica la medida independiente del miedo y de las res- 
puestas de evitación instrumental durante la adquisición. Si la teoría de los dos 
procesos es correcta cuando supone que el miedo proporciona la motivación para 
la conducta de evitación, entonces deberían ir unidos el condicionamiento a 
miedo y el de las respuestas de evitación instrumental, En contra de esta pre ic- 
ción, el condicionamiento del miedo y el de las respuestas instrumentales e e 
tación no siempre tienen una correlación alta (véase revisión de Mineka, 1979). 
Recién iniciada la investigación sobre el aprendizaje de evitación, se observó que 
los animales se volvían menos miedosos cuando aprendían la respuesta de evita- 
ción (Solomon, Kamin y Wynne, 1953; Solomon y Wyone, 1993). Desde entonces 
se han utilizado medidas del miedo más sistemáticas. Una técnica ones 
popular para medir el miedo consiste en el procedimiento de supresión con Io” 
nada descrito en los capitulos 3 y 5. En esta técnica se condiciona primero a los 
animales a dar una respuesta instrumental (como, por ejemplo, presionar una 
palanca) para obtener comida como recompensa. Se presenta después un EC con 
dicionado a la descarga mientras el sujeto está respondiendo para obtener la 
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comida. Generalmente, el EC produce una supresión en la conducta de presión de 
la palanca, y se supone que el grado de supresión de esta respuesta refleja la 
cantidad de miedo provocado por el EC. Si, en un procedimiento de evitación, la 
señal de aviso llega a provocar miedo, entonces la presentación de ese estímulo de 
aviso en un experimento de supresión condicionada debería dar como resultado la 
supresión de la conducta reforzada por la comida. Esta posibilidad fue ¡investigada 
por primera vez en un experimento por Kamin, Brimer y Black (1963). 

Kamin y sus colaboradores entrenaron primero a sus ratas para que respon- 
dieran presionando una palanca y así conseguir comida como reforzamiento en un 
programa de intervalo variable. Más tarde, en una caja lanzadera los animales 
fueron entrenados para evitar la descarga respondiendo a un EC auditivo. Se 
continuó el entrenamiento con grupos independientes de sujetos hasta que logra- 
ban evitar la descarga en 1, 3, 9 o 27 ensayos consecutivos, respectivamente. Á 
continuación, los animales eran devueltos a la siruación de presión de la palanca. 
Después de que su tasa de respuestas se había estabilizado, se presentaba periódi- 
camente el EC audirivo que se había utilizado en la caja lanzadera, para ver 
cuánta supresión producía en las respuestas. En la figura 9.6 se resumen los resul- 
tados. En esos gráficos, los valores bajos del índice de supresión indican que el EC 
de evitación de descarga produce mayor alteración de la conducta de presión de la 
palanca. Se observaron grados crecientes de supresión de la respuesta entre los 
grupos de sujetos que habían recibido entrenamiento de evitación hasta que 
lograban evitar la descarga en 1, 3 y 9 ensayos sucesivos. Sin embargo, con un 
entrenamiento de evitación más extenso la supresión de la respuesta disminula. 
Los sujetos que habían sido entrenados para evitar la descarga en 27 ensayos 
consecutivos mostraron menos supresión condicionada al EC de evitación que los 
sujetos entrenados con un criterio de 9 evitaciones consecutivas. Este resultado 
indica que el miedo, tal como se mide mediante la supresión condicionada, va 
descendiendo a medida que se alarga el entrenamiento de evitación, y llega a un 
nivel mínimo después de un entrenamiento extenso (véase también Linden, 1969; 
Srarr y Mineka, 1977). Sin embargo, el descenso del miedo no va acompañado de 
un descenso en la intensidad de la respuesta de evitación (Mineka y Gino, 1980). 

El descenso del miedo ante el EC, producto de un extenso entrenamiento de 
evitación, supone un rompecabezas para la teoría de los dos procesos. Si la reduc- 
ción del miedo es necesaria para reforzar la conducta de evitación, ¿cómo puede la 
conducta aumentar y persistir cuando hay un declive del miedo provocado por el 
EC? Un estudio reciente de McAllister, McAllister y Benton (1983) nos ofrece un 
indicio. Investigaron en ratas las cantidades relativas de miedo provocadas por el 
EC y por las claves de fondo de la cámara experimental a lo largo del entrena- 
miento de evitación discriminada, y hallaron que los animales adquirían un miedo 
sustancial al EC y a los estímulos de fondo durante los estadios iniciales del 
entrenamiento de evitación. Sin embargo, conforme avanzaba el entrenamiento, 
las ratas aprendían a discriminar entre el EC y los estímulos de fondo, y el miedo 
a los estímulos de fondo desaparecía rápidamente. El miedo a los estímulos de 
fondo descendía más rápidamente que el miedo a los EC. En consecuencia, la 
terminación del EC podía provocar una reducción del miedo a pesar de que se 
haya realizado un entrenamiento de evitación extenso. 

Según la teoría de los dos procesos, el desarrollo de una discriminación entre 
los estímulos de fondo y el EC puede contribuir a la persistencia de las respuestas 
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0 : Pigsra 9.6.—Supresión de la res- 
puesta de apretar una palanca 
para obrener comida durante un 
EC que fue previamente condi- 
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de evitación a pesar del descenso del miedo ante el EC. Sin embargo, este meca- 
nismo puede no proporcionar una explicación completa a los altos niveles de la 
respuesta de evitación en la asíntota. La falta de correspondencia entre las medi- 
das independientes del miedo y las respuestas de evitación ha sido un problema 
permanente para la teoría de los dos procesos (véase Mineka, 1979). Vamos a 
encontrar más pruebas de esta disociación en los estudios de la extinción de la 
conducta de evitación. 


Ejecución de la evitación en asíntota. La teoría de la evitación de los dos 
procesos no sólo especifica los mecanismos del proceso de adquisición de la con- 
ducta de evitación, sino que también hace predicciones acerca de la naturaleza de 
la conducta una vez que la respuesta ha sido bien aprendida. Más en concreto, 
predice que la fuerza de la respuesta de evitación fluctuará en ciclos. Siempre que 
se logre una respuesta de evitación, la descarga se omite en ese ensayo. Se supone 
que éste es un ensayo de extinción para la respuesta condicionada al miedo. La 
repetición de la respuesta de evitación (y, por tanto, los ensayos de extinción con 
el EC solo) deberían llevar a la extinción del miedo. Conforme se extingue el 
miedo existe menos reforzamiento resultante de la reducción del miedo, y la res- 
puesta de evitación también se extingue. Cuando esto ocurra, la respuesta de evi- 
tación dejará de producirse a tiempo para impedir el El. Sin embargo, cuando la 
descarga no se evita, el EC se empareja de nuevo con el El Este emparejamiento 
debería reinstaurar el miedo al EC y restablecer el potencial para el reforzamiento 
por reducción del miedo. Por tanto, la respuesta de evitación debería volver a 
condicionarse. Así pues, la teoría predice que, después de la adquisición inicial, la 
respuesta de evitación pasará por ciclos de extinción y de readquisición. Aunque 
en ocasiones se han obtenido pruebas que confirman esto (por ejemplo, Sheffield, 
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1948), la conducta de evitación normalmente no fluctúa en ciclos. Antes bien, uno 
de los aspectos más llamativos de la conducta de evitación es que es sumamente 
resistente a la extinción cuando ya no se producen más descargas, en tanto la 
respuesta continúe siendo eficaz para acabar con el EC. Después del condiciona- 
miento de evitación de lanzadera con una descarga eléctrica intensa en perros, por 
ejemplo, los animales siguen dando la respuesta de evitación durante ciertos 
ensayos sin recibir la descarga. Se observó que un perro daba la respuesta de 
evitación en 650 ensayos sucesivos después de sólo unas pocas descargas (Solo- 
mon y otros, 1953). (Para ejemplos similares de conducta de evitación persistente 
en ratas véase Levis, 1981.) 

La conducta de evitación persistente es difícil de explicar mediante la teoría de 
los dos procesos. Los primeros intentos de modificar la teoría para acomodarla a 
esos resultados (Solomon y Wynne, 1953) no obtuvieron mucho éxito (véase 
Mineka, 1979). Sin embargo, los hallazgos empíricos recientes sugieren un indicio 
si nos centramos en el papel de los estímulos de retroalimentación de la respuesta 
en el condicionamiento de evitación. En todos los procedimientos de condiciona- 
miento de evitación, la respuesta de evitación va seguida de un período libre de 
descargas. Existen también estímulos característicos de retroalimentación que 
acompañan siempre a la respuesta instrumental. Estos pueden surgir de un cam- 
bio de lugar, como cuando la rata se mueve de un lado a otro en la caja lanzadera; 
pueden ser táctiles, u otros estímulos externos implicados en dar la respuesta, 
como los que proporciona el tocar y manipular la palanca de respuesta. Los estí- 
mulos de retroalimentación de la respuesta pueden ser también claves propiocep- 
tivas (internas) proporcionadas por los movimientos musculares que intervienen 
en la respuesta. Con independencia del tipo de estímulo de que se trate, dado que 
la respuesta instrumental produce un periodo libre de descarga, los estímulos que 
acompañan a la respuesta tienen una relación negativa con la descarga. Como ya 
discutimos en el capítulo 3, ésta es una de las circunstancias que llevan al desarro- 
llo de la inhibición condicionada. Por tanto, los estímulos retroalimentadores de 
la respuesta pueden llegar a convertirse en inhibidores condicionados del miedo 
(por ejemplo, Morris, 1974; Rescorla, 1968). 

El análisis anterior sugiere que, después de un entrenamiento de evitación 
extenso, los sujetos experimentan dos estímulos condicionados sucesivos en cada 
uno de los ensayos de un procedimiento de evitación discriminada: el estímulo de 
aviso de la descarga provocador de miedo (EC+ ), seguido de claves de retroali- 
mentación inhibidoras del miedo provenientes de la respuesta de evitación (EC — ). 
Por tanto, los ensayos de evitación en asíntota no deberían de considerarse como 
ensayos de extinción en los que el EC+ se presenta solo, sino como ensayos en 
los que el EC+ va seguido de estímulos retroalimentadores de la respuesta inhi- 
bidora del miedo (EC—-). Pruebas recientes muestran que la presentación de los 
estímulos inhibidores del miedo posteriores a un EC+ pueden bloquear la extin- 
ción del EC>+ (Soltysik, Wolfe, Nicholas, Wilson y Garcia-Sánchez, 1983). Con- 
ceptualmente, este tipo de bloqueo puede equipararse al bloqueo del condiciona- 
miento excitatorio discutido en el capítulo 5. Dado que un estímulo inhibitorio es 
una señal para la ausencia de descarga, la presentación del EC — convierte la 
ausencia de descarga en los ensayos de evitación en algo totalmente esperado, y 
esto protege al EC+ de cualquier cambio en la fuerza asociativa. Otra forma de 
analizar este efecto es que la ausencia de descarga en los ensayos de evitación se 
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atribuya al EC—. Esto hace innecesario un reajuste en la valoración del EC +, lo 
que deja inalteradas sus propiedades provocadoras de miedo. Si, en los ensayos de 
extinción, las claves retroalimentadoras de la respuesta protegen al EC+ de la 
extinción, el EC+ puede seguir provocando miedo y motivando la respuesta de 
evitación. Por tanto, en el contexto de la teoría de los dos procesos este meca- 
nismo hace menos desconcertante la persistencia de la conducta de evitación a 
pesar de los numerosos ensayos sin descarga eléctrica. 


La extinción de la conducta de evitación mediante el bloqueo de la respuesta y 
la exposición al EC solo. Como ya advertimos, si la respuesta de evitación es 
eficaz para hacer que cese el EC y que no se presente ninguna descarga, la res- 
puesta de evitación se mantiene mucho tiempo. ¿Es siempre la conducta de evita- 
ción muy resistente a la extinción, o existen procedimientos que dan lugar a una 
extinción muy rápida? La respuesta es muy importante, no sólo para un análisis 
teórico de la conducta de evitación sino también para extinguir las respuestas de 
evitación patológicas o maladaptativas de los pacientes humanos. Un procedi- 
miento de extinción de la conducta de evitación eficaz y con el que se ha experi- 
mentado ampliamente es el llamado de inundación o inhabilitación de la res- 
puesta (Baum, 1970). Consiste en presentar el EC en la situación de evitación, 
pero con el instrumental alterado, de manera que se le impide al sujeto dar la 
respuesta de evitación. De esta forma, el sujeto está expuesto al EC sin que se le 
permita pararlo. En un sentido está «inundado» de EC. 

Una de las variables más importantes que determinan los efectos de un pro- 
cedimiento de inundación es la exposición forzada al EC. Esto queda bien ilus- 
trado en el experimento de Schiff, Smith y Prochaska (1972). Las ratas fueron 
entrenadas para evitar la descarga en respuesta al estímulo de aviso, un EC audi- 
tivo, en una situación de evitación de dirección única. Después que todos los 
animales evitaran la descarga en diez ensayos consecutivos, el comportamiento de 
seguridad se bloqueó con una barrera, y los sujetos recibieron distinto número de 
exposiciones al EC sin descarga. Grupos independientes de sujetos recibieron 1, 5, 
o 12 ensayos de bloqueo respectivamente, y en cada uno de esos ensayos el EC se 
presentó 1, 5, 10, 50 o 120 segundos. Después se quitaba la barrera que impedía la 
respuesta de evitación, y todos los sujetos pasaron por una prueba de extinción. 
Al comienzo de cada ensayo de extinción, el sujeto era colocado en el aparato, y se 
presentaba el EC hasta que el animal cruzaba al compartimento de seguridad, 
Durante los ensayos de extinción nunca se producía la descarga, y los sujetos 
continuaban realizando la prueba hasta que tardaban 120 segundos o más en 
cruzar al compartimento de seguridad en tres ensayos consecutivos. La fuerza de 
la respuesta de evitación se medía por el número de ensayos que necesitaban los 
sujetos para alcanzar el criterio de extinción (tres tardanzas de 120 seg con- 
secutivas). 

Como era de esperar, la exposición al EC con bloqueo facilitaba la extinción de 
la respuesta de evitación. Además, este efecto venía determinado principalmente 
por la duración total de la exposición al EC. El número de ensayos de inundación 
administrados (1, 5 o 12) facilitaba la extinción porque cada ensayo se sumaba a 
la cantidad total de tiempo que los sujetos habían estado expuestos al EC sin 
permitírseles escapar. En la figura 9.7 se resumen los resultados del experimento. . 
El aumento en la duración total de la exposición con bloqueo al EC da como 
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Figura 9.7.—Ensayos necesarios para alcanzar el nivel de extinción en grupos independientes de ani- 
males que habían recibido previamente exposiciones bloqueadas al EC (aparece el EC, pero no se 
presenta la descarga) de distintas duraciones. (Según Schiff, Smith y Prochaska, 1972.) 


resultado una extinción más rápida (véase también Baum, 1969; Weinberger, 
1965). 

La teoría de los dos procesos predice que la inundación extingue la conducta 
de evitación porque es de suponer que la exposición forzada al EC produzca una 
extinción del miedo. El hecho de que la exposición más prolongada al EC dé lugar 
a una extinción más rápida (por ejemplo, Schiff y otros, 1972) concuerda con este 
punto de vista. Sin embargo, investigaciones más detalladas sobre el papel del 
miedo en los procedimientos de inundación han proporcionado pruebas en contra 
de la teoría de los dos procesos. Las medidas independientes del miedo (con la 
técnica de la supresión condicionada, por ejemplo) han mostrado que en algunas 
situaciones la inundación extingue la conducta de evitación más rápidamente de lo 
que se extingue el miedo, mientras que en otras situaciones ocurre lo contrario 
(veáse, por ejemplo, Coulter, Riccio y Page, 1969; Mineka y Gino, 1979; Mineka, 
Miller, Gino y Giencke, 1981). Estos resultados sugieren que la extinción del 
miedo es sólo uno de los factores responsables de los efectos de los procedimien- 
tos de inundación. Otras variables a considerar pueden estar relacionadas con el 
hecho de que, durante la inundación, los sujetos no sólo reciben una exposición 
forzada al EC, sino que se les impide dar una respuesta de evitación. En ciertas 
situaciones, el bloqueo de la respuesta de evitación puede contribuir a la extinción 
de la conducta de evitación independientemente de la exposición al EC, Katzev y 
Berman (1974) realizaron una demostración de este hecho. 

Katzev y Berman condicionaron primero a las ratas para evitar la descarga en 
una caja lanzadera. Después se llevaron a cabo cincuenta ensayos de extinción. En 
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100 Figura 9.8, —Porcentaje de res- 
puestas de pasar de un lado a 
otro que se produjeron durante 
los diez primeros ensayos de 
prueba. En la fase previa del 
experimento, el grupo de con- 
trol no fue expuesto al EC, el 
grupo de contingencia de la res- 
puesta recibió exposiciones al 
EC que podían ser desconectadas 
mediante la respuesta de pasar 
de un lado a otro, y el grupo de 
no contingencia recibió exposi- 
ciones al EC independientes de 
su comportamiento. Ínicialmen- 
te, todos los sujetos recibieron 

un entrenamiento de evitación 
Control Contingencia No contingencia discriminada. (Según Katzev y 
de respuesta Berman, 1974.) 
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esta fase del experimento los sujetos se colocaron de dos en dos. Durante los 
ensayos de extinción, a un sujeto de cada par no se le bloqueaba la respuesta, de 
forma que la rata podía parar el EC cruzando al otro lado. El otro sujeto de cada 
par recibía idénticas exposiciones al EC que las que recibía la otra rata, excepto 
que la respuesta de cruzar de un lado a otro se bloqueaba con una barrera. Así 
pues, la exposición al EC era igual para los dos tipos de sujetos, pero sólo uno de 
los sujetos de cada par podía terminar el EC dando la respuesta de lanzadera. Un 
tercer grupo de ratas hacía de grupo de control y no estaba expuesto al EC (o a la 
caja lanzadera) durante esta fase. A continuación, todos los sujetos pasaron por 
una serie de ensayos estándar de extinción. La barrera se suprimía totalmente, y 
periódicamente se presentaba el EC hasta que los sujetos cruzaban al otro lado del 
aparato. En la figura 9.8 se resumen los resultados, El mayor número de respues- 
tas de cruzar de lado lo dio el grupo de control. El menor número de respuestas se 
producía en sujetos que habían recibido una exposición al EC con bloqueo. De 
hecho, era mucho menos probable que esos animales respondieran que los anima- 
les que habían recibido una exposición idéntica al EC, pero que podían siempre 
terminar las presentaciones del EC ejecutando la respuesta de lanzadera. Estos 
resultados muestran que el bloqueo de la respuesta puede facilitar la extinción de 
la conducta de evitación independientemente de las variaciones en la exposición 
al EC. Así pues, el procedimiento de inundación implica más que la simple extin- 
ción pavloviana del EC (para una discusión más detallada vease Baum, 1970; 
Mineka, 1979). Quizá, durante las exposiciones al EC con bloqueo, los sujetos 
aprenden una respuesta que es incompatible con la conducta de evitación, y esto 
contribuye a la pérdida que se observa en las respuestas de evitación. 


La evitación no discriminada (de operante libre). Como ya hemos visto, la 
teoría de los dos procesos pone gran énfasis en el papel que desempeña la señal 
de aviso, o EC, en el aprendizaje de evitación. ¿Podrían los animales aprender 
también a evitar la descarga, aun cuando no existiera en la situación un estímulo 
externo de aviso? Dentro del contexto de la teoría de los dos factores, parecería 
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casi una cuestión herética. Sin embargo, la ciencia progresa a menudo cuando los 
investigadores hacen preguntas audaces, y eso fue justamente lo que hizo Sidman 
(1953a, 1953b). ideó lo que se ha llegado a conocer como procedimiento de evita- 
ción no discriminada o de operante libre. (A veces se llama también evitación 
de Sidman.) En este procedimiento, la descarga se programa para que ocurra 
periódicamente, sin aviso, digamos cada 10 segundos. Se especifica como res- 
puesta de evitación una determinada conducta, y la aparición de esta respuesta 
impide la administración durante un período fijo, digamos 30 segundos, de la 


mucho más largos de entrenamiento que los experimentos de evitación discrimi- 
nada. Resulta extraño, por ejemplo, que un experimento de evitación discrimi- 
nada se prolongue hasta que el sujeto ha recibido cien descargas eléctricas. a 
embargo, cien descargas eléctricas no son excesivas en los estudios de evitación le 
operante libre, en parte porque a veces los sujetos necesitan una larga experiencia 
con la descarga antes de aprender a dar de forma regular la respuesta de evita- 
ción. Este extenso entrenamiento se utiliza también a menudo porque los investi- 
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descarga programada. Los animales aprenderán a evitar las descargas en esas 
condiciones aun cuando no exista un estímulo de aviso. El procedimiento se cons- 
truye a partir de dos intervalos de tiempo (véase la figura 9.9). Uno de ellos es el 
intervalo entre las descargas en ausencia de una respuesta. Se llama intervalo 
D-D (descarga-descarga). El otro periodo de tiempo esencial es el intervalo entre 
la respuesta y la descarga programada. Se llama intervalo R-D (intervalo 
respuesta-descarga). El intervalo R-D es el período de seguridad creado por la 
respuesta: En nuestro ejemplo, el intervalo D-D es de 10 segundos y el intervalo 
R-D es de 30 segundos. 

El procedimiento de evitación de operante libre difiere del de evitación dis- 
criminada no sólo en que carece de un estímulo de aviso, sino también en que 
permite que las respuestas de evitación discriminada se den en cualquier momen- 
to. En los procedimientos de evitación discriminada, la respuesta de evitación es 
eficaz para prevenir la administración de la descarga sólo si se realiza durante el 
EC. Las respuestas en ausencia del EC (el intervalo entre ensayos) no tienen 
ningún efecto. De hecho, en algunos experimentos (en concreto los que implican 
evitación de dirección única) se saca a los animales del aparato entre los ensayos. 
Por el contrario, en el procedimiento de operante libre, la respuesta de evitación, 
ocurra cuando ocurra, reinicia el intervalo R-D. Si el intervalo R-D es de 30 
segundos, la descarga se programa 30 segundos después de cada respuesta. Sin 
embargo, si responde siempre inmediatamente antes de que este intervalo R-D 
concluya, el sujeto puede siempre reinstaurar el intervalo R-D y, por tanto, pro- 
longar indefinidamente su período de seguridad. 

En los experimentos de evitación de operante libre existen varias característi- 
cas llamativas. En primer lugar, esos estudios implican generalmente períodos 
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Figura 9.9. —Diagrama del procedimiento de evitación no discriminada, o de operante libre. Cada 

aparición de la respuesta inicia un período sin descarga, como indica el intervalo R-D. En ausencia de 

respuesta, la siguiente descarga aparece tras un período fijo después de la última descarga, como indica 

el intervalo D-D. Las descargas no son sefializadas mediante un estímulo exteroceptivo y normal- 
mente son breves e ineludibles. 
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APARTADO 9.1 La teoría de los dos factores y la conducta compulsiva 


La teoría de los dos procesos ha servido como modelo importante para el análisis y 
eratamiento de las conductas obsesivo-compulsivas. Las conductas ein 
pueden adquirir muchas formas. Algunas personas están obsesionadas con el a o a la 
contaminación y dedican grandes esfuerzos a evitar la contaminación o a lavarse Eli 
de haber permanecido en contacto con un objeto temido. Otras personas Ed a a- 
ciones de forma compulsiva: pasan un tiempo excestvo comprobando los objetos $ 
ambiente o algún aspecto de su propia conducta. Hay mujeres, por ejemplo, que no pa en 
marcharse de su casa sin comprobar varias veces de forma ritual todas las puertas. iertos 
hábitos anómalos de comida y de ejercicio se consideran a veces también conductas 
obsesivo-compulsivas. En todos esos Casos, la ansiedad está inducida por un oo pe 
recimiento real o imaginario, y la conducta ritual puede considerarse como una com 2 e 
evitación reforzada por la reducción de la ansiedad. Los que se lavan de forma ri iva, 
por ejemplo, se ponen nerviosos cuando se acercan O tocan el objeto a o» > e 
temen. La ampliación del hecho de lavarse (algunos casos implican vartas duchas y cola 

al día) reduce la ansiedad. 
As los a de distintas investigaciones apoyan la suposición de que los rituales 
compulsivos reducen la ansiedad (véase, por ejemplo, Hodgson y real 1972: a 
Rachman y Hodgson, 1973). En las investigaciones experimentales la conducta a E 
es provocada, mientras que la ansiedad es medida por autoinformes, técnicas psico a ñ 
gicas u otros procedimientos. Esos estudios indican que provocar la compulsión aumen 
ansiedad, y la ejecución de conductas rituales la disminuye. edi 

Algunos procedimientos terapéuticos para la conducta obsesivo-compulsiva están bas 
dos en la teoría de los dos factores e incluyen el procedimiento de extinción de la evitación 
mediante inundación o inhabilitación de la respuesta. Se provoca la compulsión, E E 
impide el ritual. Al individuo se le «inunda» con el objeto o el AO RECREO temi as 
espera que esto produzca la extinción de la ansiedad. Los resultados de las investigac o a 
sobre este tipo de terapia han indicado o logra un gran éxito €n numerosos Cas 

É melkamp, 1982a, para una revisión). :4 al 
a pa de qe des o ha sido útil también para la comprensión de las difuncio- 
nes alimenticias de la anorexia nerviosa y la bulimia nerviosa. En la anorexia o E 
individuo come muy poco y hace excesivo ejercicio, de forma que le sobreviene una pérdi E 
de peso rápida. En la bulimia nerviosa, el individuo pasa por ciclos de o pres 

siva (borrachera de comida) seguida de vómitos. Rosen y Leitenberg (1982) descril 
ambos desórdenes como el resultado de un miedo mórbido a engordar. Comer, en da 
lar comer con gula, aumenta esa ansiedad. En la anorexia nerviosa, la ansiedad se a LS 
evitando la comida y realizando excesivo ejercicio. En la bulimia nerviosa, la a se 
reduce vomitando. Leitenberg y sus colaboradores (Leitenberg, Gross, Peterson y ao 
1984) trataron con éxito a los individuos bulímicos a rravés de la o de la Sl 
puesta. Se pidió a los clientes que comieran hasta que sintieran la aa a E 
terapeuta les impedía entonces vomitar y no se libraban de la supervisión a e a 
necesidad apremiante había desaparecido por completo. Como se había es os clie 
tes informaron de un aumento de la ansiedad y de un aumento en la necesida apremiante 
de vomitar cuando comían. Sin embargo, ambas ansiedades descendían con la repetición de 


las sesiones de tratamiento. 
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gadores se interesan especificamente por saber qué ajustes en su estado de equili- 
brio realizan los animales durante esos programas de estimulación aversiva. Asi, 
en muchos casos, el experimento no se centra principalmente en el aprendizaje 
inicial de la conducta de evitación. Otra característica general de esos experimen- 
tos es que, con frecuencia, aun después de un entrenamiento extenso, los animales 
no aprenden nunca a evitar todas las descargas. Por último, distintos sujetos a 
menudo se diferencian enormemente en la forma de responder ante idéntico pro- 
cedimiento de evitación de operante libre. 

Las figuras 9.10 y 9.11 ilustran los tipos de resultados que pueden obtenerse 
con el entrenamiento de evitación de operante libre. Cada figura muestra los 
registros acumulativos de presión de la palanca durante períodos sucesivos de una 
hora, con dos ratas que fueron expuestas por primera vez al procedimiento de 
evitación. Cuando no se presionaba la palanca, los sujetos recibían una descarga 
cada 5 segundos (intervalo D-D). Cada respuesta de presión de la palanca iniciaba 
un periodo de 20 segundos sin descargas (intervalo R-D). Las descargas se indi- 
can por las desviaciones hacia abajo del registro acumulativo. La rata H-28 (figura 
9.10) recibía muchas descargas al principio, pero comenzaba a presionar la 
palanca incluso durante la primera hora de entrenamiento. Alcanzó un alto nivel 
de respuestas durante la segunda hora de la sesión, y después bajó a una tasa 


Figura 9.10.—Registro acumula- 
Sesión 1 tivo de la presión de palanca por 
una rata, la primera vez que fue 
sometida a un procedimiento de 
evitación no discriminada. Los 
números de la derecha indican 
las sucesivas horas de exposición 
al procedimiento. Las marcas 
oblicuas indican la liberación de 
la descarga. (Según Sidman, 
1966.) 
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Fiexra 9.11.—Registro acumula- 
Rara 0-10 tivo de la presión de palanca por 
D-D 5” una rata, la primera vez que fue 
R-D 20” sometida a un procedimiento de 
evitación no discriminada. Los 
números de la derecha indican 
las sucesivas horas de exposición 

. al procedimiento. Las marcas 
Sesión 1 oblicuas indican la liberación de 

la descarga. (Según Sidman, 


1966.) 
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estable de presión de la palanca en las 5 horas siguientes que funcionó el proce- 
dimiento. En esas condiciones éste era su patrón de respuesta estable. La rata 
H-28 era una aprendiz particularmente rápida. Sin embargo, incluso al final de 
las 7 horas de entrenamiento recibía más de 25 descargas / hora. 

La rata 0-10 (figura 9.11) no actuaba tan bien como la rata H-28. Recibía 
muchas más descargas y nunca conseguía una tasa alta de respuestas. Su patrón 
estable de conducta después de varias horas de entrenamiento consistía siempre 
en esperar a que se produjera la descarga al final del intervalo R-D antes de 
volver a responder. Normalmente no respondía para reiniciar el intervalo R-D, y 
no obtenía períodos prolongados sin descarga. Por tanto, recibía una descarga 
cada 20 segundos aproximadamente, como estaba establecido en el intervalo R-D. 

Se han llevado a cabo numerosos experimentos sobre conducta de evitación de 
operante libre (véase Hineline, 1977; Sidman 1966). La tasa de respuestas está 
determinada por los valores de los intervalos D-D y R-D. Cuanto mayor es la 
frecuencia de las descargas en ausencia de respuestas (el intervalo D-D), mayor 
será la probabilidad de que el animal aprenda la respuesta de evitación. Áumen- 
tando los períodos de seguridad que produce la respuesta (el intervalo R-D) se 
favorece igualmente la conducta de evitación. Son importantes además los valores 
relativos de los intervalos D-D y R-D. Por ejemplo, no es probable que los ani- 
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males den la respuesta instrumental si el intervalo R-D es más corto que el 
intervalo D-D. 

La conducta de evitación no discriminada presenta un desafio a la teoría de los 
dos procesos porque no existe ningún EC explícito que provoque miedo condicio- 
nado, y no está clara la forma en que la respuesta de evitación reduce el miedo. 
Sin embargo, la teoría de los dos procesos no se ha abandonado totalmente en 
algunos intentos por explicar la evitación de operante libre (véase Anger, 1963). 
Los intervalos D-D y R-D utilizados en los procedimientos eficaces son normal- 
mente cortos (menos de un minuto). Además, permanecen fijos durante el expe- 
rimento, de forma que los intervalos son sumamente predecibles. Por tanto, es 
razonable sugerir que los animales podrían aprender a responder al paso del 
tiempo como señal de la descarga. Esta suposición acerca de la existencia de un 
condicionamiento temporal permite la aplicación de los mecanismos de la teoría 
de los dos procesos a los procedimientos de evitación. La estrategia básica es 
suponer que el paso del tiempo desde la última descarga (en el caso del intervalo 
D-D o desde la última respuesta R-D) se condiciona para provocar miedo. Ya que el 
tiempo se empieza a medir de nuevo cada vez que aparece la respuesta de evitación, 
la respuesta elimina de forma eficaz las claves temporales provocadoras de miedo. 
El cese de estas señales temporales puede entonces reforzar la respuesta de evita- 
ción a través de la reducción del miedo. Así pues, se supone que las claves tempora- 
les que conlleva el acercarse al final del intervalo D-D o R-D desempeñan el mismo 
papel que el EC explícito en los procedimientos de evitación discriminada, 

El análisis anterior de la evitación de operante libre en términos de la teoría 
de los dos procesos predice que los sujetos no distribuyen sus respuestas al azar 
en el tiempo. Antes bien, es más probable que respondan cuando se acerca el final 
del intervalo R-D, porque es entonces cuando las claves temporales posiblemente 
provocan miedo. Se han obtenido resultados que confirman esta predicción. Sin 
embargo, muchos animales logran evitar muchas descargas sin distribuir sus res- 
puestas de la manera que predice la teoria de los dos procesos. Además, la distri- 
bución de las respuestas predicha a menudo se desarrolla sólo después de un 
entrenamiento extenso, después de que los sujetos han evitado muchas de las 
descargas programadas (véase Sidman, 1966). Más aún, la conducta de evitación 
se ha logrado condicionar utilizando procedimientos de operante libre en los que 
los intervalos D-D y R-D se variaban a lo largo del experimento (por ejemplo, 
Herrnstein y Hineline, 1966). Cuando la duración de los intervalos D-D y R-D es 
impredecible, disminuye la probabilidad de que los sujetos sean capaces de apren- 
der a utilizar el paso del tiempo como señal para la descarga. Es difícil, por tanto, 
adaptar la teoría de los dos procesos para explicar el aprendizaje de evitación. 
Resultados de este tipo han disuadido a algunos investigadores de aceptar la teoría 
de los dos procesos como explicación del aprendizaje de la evitación de operante 
libre (para una discusión adicional, véase Herrnstein, 1969; Hineline, 1977, 1981). 


Explicaciones teóricas alternativas de la conducta de evitación 
En la discusión anterior sobre las investigaciones experimentales de la conducta 


de evitación, utilizábamos la teoría de los dos procesos para proporcionar un marco 
conceptual. Esto no dejaba de ser razonable porque muchas de las cuestiones plan- 
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teadas por tales investigaciones estaban estirmmuladas de una forma u otra por la 
teoría de los dos procesos. Como vimos, sin embargo, los resultados experimenta- 
les no apoyan en todos los casos la teoría. Por consiguiente, se han propuesto 
varias modificaciones y alternativas a la teoría de los dos procesos. Vamos a discu- 
tir algunas de las más importantes. En la teoría de los dos procesos se supone que 
el reforzamiento de la respuesta de evitación está producido por la reducción del 
miedo. Este es un caso de reforzamiento negativo (el reforzamiento debido a la 
desaparición del estado aversivo). Varios tratamientos teóricos recientes sostienen 
que los procedimientos de evitación también dan lugar a un reforzamiento positivo 
de la respuesta de evitación, mientras que otros han sugerido que ni el reforza- 
miento positivo ni el negativo son importantes para el aprendizaje de evitación. 


El reforzamiento positivo mediante la inbibición condicionada del miedo. 
Como ya advertimos antes, la ejecución de una respuesta de evitación siempre 
produce unos estímulos de retroalimentación característicos, tales como las claves 
espaciales que conlleva el ir de un lado a otro en una caja lanzadera, o las táctiles y 
otros estímulos externos que intervienen en la presión de la palanca de respuesta. 
Dado que la respuesta de evitación produce un período de seguridad en todos los 
procedimientos de condicionamiento de evitación, los estímulos de retroalimenta- 
ción de la respuesta pueden adquirir propiedades inhibitorias condicionadas y con- 
vertirse en señales para la ausencia de estimulación aversiva. Puesto que resulta 
deseable un período sin descarga eléctrica, el estímulo inhibitorio condicionado 
para la descarga puede hacer de reforzador positivo. De esta forma, los estímulos 
que acompañan a las respuestas de evitación pueden proporcionar un reforza- 
miento positivo para la conducta de evitación. (Esta hipótesis se llama también 
teoría de la señal de seguridad de la evitación.) 

En la mayoría de los experimentos de evitación no se toman medidas especia- 
les para asegurar que la respuesta de evitación vaya acompañada de estímulos de 
retroalimentación intensos que podrían convertirse en inhibidores condicionados. 
Los estímulos espaciales, táctiles y propioceptivos, que no se programan específi- 
camente, pero que inevitablemente acompañan a la respuesta de evitación, cum- 
plen esta función. Sin embargo, podemos modificar fácilmente cualquier proce- 
dimiento de evitación para proporcionar un estímulo característico, tal como una 
luz breve o un sonido, después de cada ejecución de la respuesta de evitación. El 
modelo de reforzamiento de la inhibición condicionada predice que la introduc- 
ción de un estímulo de retroalimentación explícito facilita el aprendizaje de una 
respuesta de evitación. Numerosos experimentos lo han confirmado (por ejem- 
plo, Bolles y Grossen, 1969; D'Amato, Fazzaro y Etkin, 1968; Keehn y Nakkash, 
1959). Otros estudios han mostrado que a lo largo del entrenamiento de evita- 
ción, un estímulo retroalimentador de la respuesta se transforma en un inhibidor 
condicionado del miedo (por ejemplo, Morris, 1974; Rescorla, 1968). Además, 
existen pruebas directas de que el estímulo retroalimentador que se ha condicio- 
nado para inhibir el miedo durante el entrenamiento de evitación se hace, de este 
modo, un reforzador positivo eficaz para nuevas respuestas (Morris, 1975; Wels- 
man y Litner, 1972; véase también Dinsmoor y Sears, 1973). Así pues, existen 
pruebas considerables de la existencia de un factor de reforzamiento por inhibi- 
ción condicionada en el aprendizaje de evitación. 

Existen semejanzas y diferencias importantes entre el reforzamiento positivo 
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de la conducta de evitación mediante la inhibición condicionada, y el proceso de 
reforzamiento negativo que supone la teoría de los dos procesos. En ambos 
mecanismos interviene una reducción del miedo. Sin embargo, la forma en que 
esto ocurre es diferente en los dos casos. Un inhibidor condicionado inhibe acti- 
vamente el miedo, mientras se supone que la terminación del EC lleva a la dispo- 
sición pasiva del miedo. Dado que ambos mecanismos conlleyan una reducción 
del miedo, el funcionamiento de los dos procesos depende de la existencia de 
miedo. Sin embargo, el proceso de reforzamiento de la inhibición condicionada es 
menos restrictivo acerca del origen del miedo. En la teoría de los dos procesos se 
supone que el miedo está provocado por el estímulo discriminativo explícito para 
la descarga (el EC). Por el contrario, el miedo también puede estar provocado por 
otros estímulos para la hipótesis del reforzamiento de inhibición condicionada. 
Por ejemplo, el miedo podría estar provocado por claves situacionales del 
ambiente en el que se lleva a cabo un condicionamiento de evitación. 

El hecho de que el miedo provocado por las claves situacionales pueda sumi- 
nistrar la base para el reforzamiento de la inhibición condicionada hace que la 
hipótesis de la señal de seguridad resulte apropiada para explicar la conducta de 
evitación de operante libre. Los sujetos con frecuencia experimentan numerosas 
descargas durante la adquisición de la conducta de evitación de operante libre. 
Esto, y la ausencia de un estímulo de aviso exteroceptivo, hacen altamente proba- 
ble que toda la situación experimental se condicione para provocar miedo. Dado 
que las descargas nunca ocurren durante el intervalo R-D posterior a la respuesta, 
los estímulos propioceptivos y táctiles que acompañan a las respuestas pueden 
llegar a convertirse en inhibidores del miedo. Así pues, las claves de retroalimen- 
tación asociadas a la respuesta pueden llegar a provocar un reforzamiento positivo 
de la respuesta de evitación de operante libre (Dinsmoor, 1977; Rescorla, 1968). 

Es importante darse cuenta de que el mecanismo de reforzamiento por inhibi- 
ción condicionada no es incompatible, o necesariamente un sustituto, con el pro- 
ceso de reforzamiento negativo defendido por la teoría de los dos procesos. Es 
decir, el reforzamiento negativo a través de la terminación del EC y el reforza- 
miento positivo a través de las claves condicionadas imhibitorias de retroalimenta- 
ción podrían coexistir, y contribuir ambas al fortalecimiento de la conducta de 
evitación (véase Cicala y Owen, 1976; Owen, Cicala y Herdegen, 1978). 


El reforzamiento de la evitación mediante la reducción de la frecuencia de 
descarga. El mecanismo de reforzamiento por inhibición condicionada no pre- 
senta una alternativa radical a la teoría de la evitación de los dos procesos. Por el 
contrario, otro mecanismo de reforzamiento, la reducción de la frecuencia de 
descarga, se ha propuesto como una alternativa a la teoría de los dos procesos 
(deVilliers, 1974; Herrnstein, 1969; Herrnstein y Hineline, 1966; Hineline, 1981; 
Sidman, 1962). Por definición, las respuestas de evitación impiden la presenta- 
ción de la descarga y, por tanto, reducen la frecuencia de las descargas que recibe 
el sujeto. Las teorías de la evitación que se han discutido hasta ahora han conce- 
bido la reducción de las descargas casi como un producto incidental de las respues- 
tas de evitación, más que como una causa primaria inmediata de la conducta. Por 
el contrario, la postura de la reducción de la frecuencia de descarga concibe la 
evitación de la descarga como esencial para la motivación de la conducta de 
evitación. 


Mi 
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Sidman (1962) fue el primero en mantener que la causa de la conducta de 
evitación era la reducción de la frecuencia de las descargas, al explicar los resulta- 
dos que obtenía en un experimento concurrente de evitación de operante líbre. 
Las ratas fueron expuestas al mismo tiempo a dos programas de evitación de 
operante libre. Las respuestas en una palanca impedían las descargas en uno de 
los programas, las respuestas en la otra palanca impedían las descargas en el 
segundo programa. Sidman llegó a la conclusión de que los sujetos distribuían sus 
respuestas entre las dos palancas con objeto de reducir la frecuencia total de des- 
cargas recibidas. La idea de que la reducción de la frecuencia de la descarga puede 
servir para reforzar la conducta de evitación fue fomentada más tarde cuando se 
comprobó que existía aprendizaje con un procedimiento de evitación de operante 
libre diseñado especificamente para minimizar el papel de las claves temporales 
condicionadas al miedo (Herrnstein y Hineline, 1966). Además, los estudios sobre 
la importancia relativa de los distintos componentes del procedimiento de evita- 
ción discriminada han mostrado también que el componente de evitación contri- 
buye significativamente al aprendizaje (por ejemplo, Bolles, Stokes y Younger, 
1966; véase también Bolles, 1972; Kamin, 1956). 

Aunque las pruebas citadas arriba indican claramente que es importante la 
evitación de la descarga, es discutible el mecanismo responsable de esos resulta- 
dos. Varios experimentos han demostrado que los animales pueden aprender a 
dar una respuesta de evitación aun cuando la respuesta no reduzca la frecuencia de 
administración de las descargas (por ejemplo, Gardner y Lewis, 1976, Hineline, 
1970). En estos estudios, las respuestas retrasaban el comienzo de la siguiente 
descarga programada, pero no impedían su aparición. Así pues, la respuesta ins- 
trumental no alteraba la frecuencia total de las descargas. Esos resultados pueden 
explicarse utilizando la bipótesis de la reducción de la frecuencia de descarga si 
suponemos que los sujetos calculan la frecuencia de las descargas solamente a lo 
largo de un período limitado, posterior a la respuesta de evitación. Sin embargo, 
la hipótesis no especifica la duración de esos intervalos, dejando que sean deter- 
minados experimentalmente (véase, por ejemplo, Logue, 1982). 

Al evaluar la hipótesis de la reducción de la frecuencia de descarga, debemos 
considerar también hasta qué punto las pruebas que sostienen la hipótesis pueden 
ser explicadas de otra forma (en concreto, a través del reforzamiento por inhibición 
condicionada o a través de los efectos punitivos de la descarga en ausencia de una 
contingencia de evitación). Si una respuesta reduce la frecuencia de las descargas, 
los estímulos externos y propioceptivos implicados en la ejecución de la respuesta 
llegarán a señalar la ausencia de descarga y se convertirán en inhibidores condi- 
cionados. Las propiedades inhibitorias condicionadas de esos estímulos pueden 
después reforzar la conducta. Este mecanismo de inhibición condicionada es una 
alternativa plausible a la interpretación en base a la frecuencia de las descargas, 
particularmente pará los experimentos de evitación de operante libre (por ejem- 
plo, Herrnsteín y Hineline, 1966). De hecho, es una explicación que se puede 
aplicar más ampliamente. A diferencia de la hipótesis de la frecuencia de descarga, 
la teoría de la inbibición condicionada puede también explicar los resultados revi- 
sados en la presente sección referentes a las propiedades de las claves retroalimen- 
tadoras de la respuesta en los experimentos de evitación. 
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La conducta de evitación y las reacciones de defensa específicas de la especie. 
Las teorías expuestas hasta ahora se han referido fundamentalmente a la forma 
en que los hechos que preceden y que siguen a las respuestas de evitación contro- 
lan la conducta de evitación. La naturaleza exacta de la respuesta instrumental que 
se necesita para impedir las descargas programadas no constituyó el interés pri- 
mordial de esas teorías. Además, todos los mecanismos de reforzamiento que 
suponían las teorías necesitaban algún tiempo para desarrollarse. Ántes de que la 
reducción del miedo pudiera resultar un reforzador eficaz, el miedo tenía que 
condicionarse al EC; antes de que las claves de retroalimentación pudieran hacer 
de reforzadores, tenían que convertirse en señales para la ausencia de descarga, y 
antes de que la reducción de la frecuencia de descarga pudiera funcionar, los suje- 
tos tenían que experimentar un número suficiente de descargas para ser capaces 
de valorar las frecuencias de descarga. Por tanto, esas teorías nos dicen muy poco 
sobre lo que determina la conducta del organismo durante los primeros ensayos 
del entrenamiento de evitación. La falta de interés por lo que el sujeto hace 
| durante estos pocos ensayos resulta un punto débil importante. Para que el meca- 
: nismo de evitación sea muy útil al sujeto en su hábitat natural, el proceso tiene 
que generar muy rápidamente respuestas de evitación adecuadas. 51 un animal 
está tratando de evitar ser comido por un predador, por ejemplo, puede que no 
| continúe vivo para experimentar la repetición de ensayos de entrenamiento. 
En contraste con las teorías que considerábamos anteriormente, la hipótesis 
| sobre la conducta de evitación que vamos a discutir en la presente sección se 
centra en la naturaleza específica de la respuesta instrumental que se necesita 
para impedir la descarga, y se propone discernir qué es ló que controla la con- 
ducta del sujeto durante los primeros estadios del entrenamiento de evitación 
(Bolles, 1970, 1971). La teoría empieza por reconocer que los estímulos y situa-. 
ciones aversivos provocan en los animales intensas respuestas incondicionadas, O 
innatas. Se supone que muchas de esas respuestas innatas se han desarrollado 
porque permiten al organismo cooperar con los acontecimientos aversivos o pro- 
' tegerse de ellos. Por tanto, Bolles ha llamado a esas respuestas innatas reacciones 
de defensa específicas de la especie (RDEE). Hemos visto ya algunos ejemplos 
| de RDEE. La conducta de agrupamiento en las aves, dirigida a un predador 
potencial (capítulo 2) es una RDEE social particularmente complicada. Otro 
| ejemplo es la tendencia de los ejemplares jóvenes de ciertos cíclidos a guardar las 
| crías en la boca y nadar hacia zonas oscuras cuando el agua se remueve (capí- 
| tulo 2). En las ratas y otros muchos animales, entre las reacciones de defensa 
específicas de la especie se incluye el vuelo (la carrera), quedarse petrificado 
(inmovilidad), la lucha y los enterramientos defensivos. El que se observe una de 
estas respuestas u otra depende de las circunstancias. Si existe una clara salida de 
la situación, la huida puede ser la respuesta predominante, Cuando la carrera no 
! es posible, puede ser mejor quedarse petrificado. $i en la situación está presente 
otro animal, la lucha puede ser la conducta más probable. 

La formulación de una RDEE para la conducta de evitación establece que las 
| reacciones de defensa específicas de la especie predominan durante los estadios 
E iniciales del entrenamiento de evitación. Si la RDEE más probable logra impedir 

las descargas, esta conducta persistirá mientras el procedimiento de evitación 
tenga lugar. Sila primera RDEE no es eficaz, 1rá seguida de una descarga, que 
suprimirá la conducta a través del castigo. El animal dará después la siguiente 
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RDEE más probable. Si la descarga persiste, esta segunda RDEE también se 
suprimirá a través del castigo, y el organismo dará la tercera RDEE en probabili- 
dad. El proceso terminará cuando se encuentre una respuesta eficaz para evitar las 
descargas, de forma que la respuesta no se suprima a través del castigo. Así pues, 
de acuerdo con la teoría de la RDEE, el castigo es el responsable de la selección de 
la respuesta instrumental de evitación a partir de las actividades del organismo. 
Además, se supone que la gama de respuestas de que dispone un sujeto en una 
situación aversiva queda restringida a las reacciones defensivas específicas de su 
especie. El reforzamiento, ya sea positivo o negativo, se supone que desempeña 
un papel menor, si es que juega alguno, en el aprendizaje de evitación. La res- 
puesta de evitación correcta no se fortalece con el reforzamiento. Antes bien, se 
presenta porque otras RDEE son suprimidas mediante el castigo. 

Una de las predicciones obvias de la teoría de la RDEE es que unos tipos de 
respuestas se aprenden más fácilmente en los experimentos de evitación que 
otros. De acuerdo con esta predicción, Bolles (1969) halló que las ratas pueden 
aprender rápidamente a correr en una rueda giratoria para evitar la descarga. 
Por el contrario, la ejecución de una respuesta de alzamiento (sentarse sobre sus 
patas traseras) no mejoraba utilizando un entrenamiento de evitación. Presumi- : 
blemente, el correr se aprendía más rápidamente porque se aproximaba más a las 
reacciones de defensa específicas de la especie de las ratas. En otro estudio, Gros- 
sen y Kelley (1972) estudiaron inicialmente las respuestas de los sujetos a la 
descarga antes de seleccionar las respuestas de evitación. Se colocaba a las ratas en 
una superficie grande y plana de rejilla metálica. Cuando se presentaba la des- 
carga era muy probable que los animales se quedaran paralizados cerca de las 
paredes del aparato (tigmotaxia). Se colocaba una plataforma en el suelo de reji- 
lla, en el centro o cerca de las paredes laterales, y los amimales debían saltar 
dentro de la plataforma para evitar la descarga. Se producía un aprendizaje más 
rápido cuando la plataforma estaba cerca de los lados del aparato que cuando 
estaba en el centro de la superficie. Así pues, la ejecución de la evitación se podía 
predecir con precisión a partir de las reacciones inmatas de los sujetos ante la 
descarga. En un importante experimento, continuador de éste, Grossen y Kelley 
también demostraron que la posición de la plataforma mo influía si los sujetos 
eran reforzados con comida cuando daban la respuesta de salto. 


La hipótesis del estímulo consumatorio como recompensa. La teoría de la 
RDEE difiere de otras teorías sobre la conducta de evitación que hemos conside- 
rado hasta ahora, no sólo en el énfasis que pone en la forma de la respuesta de 


evitación, sino también en su interés por las contribuciones de las tendencias 


conductuales innatas al aprendizaje de evitación. Sostiene que las reacciones de 
defensa específicas de la especie son adaptaciones que se han desarrollado para 
facilitar la supervivencia en situaciones de peligro. El último mecanismo del 
aprendizaje de evitación que vamos a considerar, la hipótesis del estímulo con- 
sumatorio como recompensa, es igualmente sensible a las contribuciones de la 
evolución a la conducta de evitación, pero se centra en el estimulo más que en los 
aspectos de la respuesta en la conducta defensiva, Masterson y Crawford (1982) 
advirtieron que cada respuesta de defensa especifica de la especie produce el con- 
siguiente conjunto de estímulos concretos. La paralización, por ejemplo, da lugar 
a una configuración fija de estimulos propioceptivos, auditivos y ambientales 


a una CUMLIYUración rija de estimulos propioceptivos, auditivos y ambientales 
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cuando el animal se queda quieto. Por el contrario, la huida produce una multitud 
de claves visuales, olfativas, auditivas y propioceptivas rápidamente cambiantes. 
Dado que esos estímulos provienen de la terminación, o consumación, de las 
respuestas de defensa, se llaman «estímulos comsumatorios de defensa». 
Masterson y Crawford propusieron que las situaciones aversivas inducen un 
sistema de motivación defensiva que mo sólo incrementa la probabilidad de res- 
puestas inmatas concretas, sino que también convierte a los estímulos consumato- 
rios de defensa en reforzadores eficaces. Se supone que en situaciones aversivas 
los estímulos consumatorios de defensa conforman y refuerzan positivamente la 
conducta, de una manera amáloga a la de la reducción del impulso a través del 
reforzamiento con comida, Del mismo modo que se supone que la privación de 
comida induce a respuestas de búsqueda de comida, y hace que los estímulos rela- 
cionados con la comida refuercen positivamente, es de suponer que los estímulos 
aversivos inducen a una conducta defensiva y hacen de los estímulos relacionados 
con la defensa reforzadores positivos. (Véase Bolles y Fanselow, 1980, para una 
concepción diferente de los procesos perceptuales en la conducta defensiva.) 
La hipótesis del estimulo consumatorio como recompensa predice que los 
animales adquieren rápidamente diversas respuestas de defensa no biológicas 
para evitar el condicionamiento, con tal de que esas respuestas produzcan estímu- 
los consumatorios de defensa. Crawford y Masterson (1978) comprobaron esta 
predicción en un estudio con ratas condicionadas a presionar la palanca de res- 
puesta en un programa de evitación discriminada. Dos grupos de sujeros fueron 
reforzados con estímulos consumatorios de defensa asociados con la huida cuando 
daban una respuesta de evitación (una presión de la palanca). A uno de estos 
grupos se le permitía correr a un compartimento de seguridad si daba la respuesta 
de presión de la palanca; al segundo grupo se le llevaba al compartimento de 
seguridad después de presionar la palanca. Un tercer grupo de ratas servía de 
control y permanecía en la cámara experimental después de cada presión de la 
palanca. De acuerdo con la hipótesis del estimulo consumatorio como recom- 
pensa, alcanzar el compartimento de seguridad después de presionar la palanca 
facilitaba de forma significativa la conducta de evitación discriminada. Esto se 
cumplía siempre que las ratas ejecutaban la respuesta de huida o eran llevadas al 
compartimento de seguridad por el experimentador. Un segundo experimento 
(Masterson, Crawford y Bartter, 1978) mostró que la permanencia en el compar- 
timento de seguridad durante el intervalo entre ensayos facilitaba la evitación. 
La hipótesis del estímulo consumatorio como recompensa proporciona un 
enfoque interesante, pero muy poco comprobado, del análisis del aprendizaje de 
eviración. Posteriores comprobaciones experimentales de la teoría tendrán que 
prestar particular atención a la distinción entre esta hipótesis y la hipótesis de la 
señal de seguridad. Ya sabemos que introducir claves distintivas de retroalimenta- 
ción de la respuesta facilita enormemente el aprendizaje de evitación porque esos 
estímulos se convierten en inhibidores condicionados del miedo. La hipótesis del 
estímulo consumatorio como recompensa sostiene que ciertos tipos de claves 
retroalimentadoras (las que provienen de RDEE innatas) son mucho más eficaces 
como reforzadores de la conducta de evitación que los estímulos auditivos o visua- 
les arbitrarios. En contraposición con la hipótesis de la señal de seguridad, se 
supone que el efecto reforzador positivo de esos estímulos especiales se activa 
inmediatamente cuando un animal se encuentra con una situación aversiva, y no 
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depende de la existencia de un período de condicionamiento inhibitorio. Investi- 
gaciones futuras tendrán que suministrar pruebas significativas para esas afirma- 
ciones antes de que los estímulos consumatorios recompensantes se puedan acep- 
tar como otra fuente de reforzamiento para la conducta de evitación. 


El problema de la evitación: comentarios finales 


Hemos aprendido mucho sobre la conducta de evitación en los últimos 40 
años desde que Mowrer y Lamoreaux (1942) se esforzaron por descubrir cómo 
«no conseguir algo» puede motivar respuestas de evitación. Como ya hemos visto, 
se han ofrecido numerosas respuestas ingeniosas a ese problema. La teoría de los 
dos procesos, el reforzamiento inhibidor condicionado, el reforzamiento por 
reducción de la frecuencia de la descarga, y el estímulo consumatorio como 
recompensa, ofrecen, todos, diferentes puntos de vista sobre lo que ocurre des- 
pués de una respuesta de evitación para que ésta se refuerce. Por el contrario, la 
teoría del RDEE sugiere una alternativa de castigo a las teorías del reforzamiento. 
Ninguna de esas teorías puede explicar todos los datos. Sin embargo, cada una de 
ellas ofrece ideas útiles para la comprensión de los distintos aspectos de la con- 
ducta de evitación. Por ejemplo, ninguna de las formulaciones más recientes es 
tan útil para explicar los experimentos del impulso adquirido como la teoría de 
los dos procesos. La teoría de la inhibición condicionada es particularmente útil 
para explicar la conducta de evitación de operante libre, los resultados de los 
estudios del papel de los estímulos retroalimentadores de la respuesta en el condi- 
cionamiento de evitación, y el mantenimiento de la conducta de evitación en 
ausencia de un miedo fuerte provocado por el estímulo de aviso. Por el contrario, 
las teorías de la RDEE y del estímulo consumatorio recompensante son muy 
útiles a la hora de considerar lo que ocurre durante los primeros estadios del 
entrenamiento de evitación. También ofrecen ideas importantes acerca de por qué 
determinadas respuestas se adquieren mucho más fácilmente que otras en las 
situaciones de evitación. Dada la complejidad del aprendizaje de evitación, el uso 
de varios marcos conceptuales para explicar todos los datos resulta inevitable. 


EL CASTIGO 


Aunque todos los días la mayoría de nosotros nos vemos envueltos en conduc- 
tas de evitación de uno u otro tipo, existe poca conciencia o interés acerca de lo 
que implican las respuestas de evitación. Esto puede ocurrir porque el condicio- 
namiento de evitación raramente se utiliza para controlar la conducta de los otros. 
Por el contrario, el otro proceso de condicionamiento aversivo que vamos a discu- 
tír, el castigo, ha despertado siempre un gran interés en la gente. En algunas 
situaciones el castigo se utiliza corno forma de retribución o como el precio de una 
conducta indeseable. Con frecuencia se utiliza también la amenaza del castigo para 
fomentar la adhesión a códigos de conducta religiosos y civiles. Se han desarro- 
llado muchas instituciones y reglas para asegurar que el castigo se va a adminis- 
trar de una forma que la sociedad juzgue ética y aceptable. Y es más, cuándo un 
castigo está justificado constituye un tema de continuo debate en el sistema de 
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justicia criminal, en la educación de los niños, en las escuelas y en todas partes. 
En contraste con los intereses de la sociedad sobre el castigo, los psicólogos 
experimentales no dedicaron demasiada atención al tema durante muchos años. 
En base a unos pocos experimentos, Thorndike (1932) y Skinner (1938, 1953) 
llegaron a la conclusión de que el castigo no es un método muy eficaz para contro- 
lar la conducta y, en el mejor de los casos, tiene sólo efectos temporales (véase 
también Estes, 1944). Esta afirmación no fue puesta en cuestión seriamente hasta 
los años sesenta, cuando el fenómeno del castigo comenzó a investigarse mucho 
más extensamente (Azrin y Holz, 1966; Campbell y Church, 1969; Church, 1963; 
Solomon, 1964). Vamos a describir los efectos del castigo sobre la conducta ins- 
trumental reforzada positivamente. En esas situaciones, el castigo puede ser una 
técnica muy eficaz para modificar la conducta. De hecho, el castigo suprime la 
conducta en sólo uno o dos ensayos. Así pues, habitualmente, el castigo produce 
un cambio en la conducta mucho más rápido que otras formas de condiciona- 
miento instrumental, tales como el reforzamiento positivo o la evitación, 


Análisis experimental del castigo 


El procedimiento básico del castigo consiste en presentar un estímulo aversivo 
después de una respuesta específica. El resultado normal del procedimiento es que 
se suprime la respuesta en cuestión. Al no dar la respuesta castigada, el sujeto 
evita la estimulación aversiva. Dado que el castigo conlleva la supresión de la 
conducta, puede observarse sólo con respuestas cuya aparición en ausencia del 
castigo resulta probable. Para asegurar la aparición de la conducta, los estudios 
experimentales del castigo normalmente contienen también un reforzamiento de 
la respuesta castigada con algo como comida o agua. Por tanto, los sujetos con 
frecuencia se enfrentan al conflicto entre responder y obtener reforzamiento posi- 
tivo, O no responder para evitar el castigo. El grado que alcance la supresión de la 
respuesta viene determinado tanto por las variables relacionadas con la presenta- 
ción del estímulo aversivo, como con las variables relacionadas con la disponibjli- 
dad del reforzamiento positivo. 


Las características del estímulo aversivo y su método de introducción. Se ha 
utilizado una gran variedad de estimulos aversivos en los experimentos de cas- 
tigo, entre los que hay que incluir una descarga eléctrica, una corriente de aire, un 
ruido fuerte, un golpe en el cuerpo, y una clave previamente condicionada a una 
descarga (Azrin, 1958; Hake y Azrin, 1965; Masserman, 1946; Skinner, 1938). 
Otros procedimientos de supresión de la respuesta han implicado la pérdida del 
reforzamiento positivo, el «tiempo fuera» del reforzamiento positivo y la sobre- 
corrección (Foxx y Azrin, 1973; Thomas, 1968; Trenholme y Baron, 1975). El 
tiempo fuera se refiere a la eliminación de la oportunidad de obtener reforza- 
miento positivo. El «tiempo fuera» se utiliza, a menudo, para castigar a los niños, 
como cuando a un niño se le dice «ve a tu cuarto» después de hacer algo malo. La 
sobrecorrección consiste en pedir a una persona no sólo que rectifique lo que ha 
hecho mal, sino que corrija los efectos de la falta. Por ejemplo, a un niño que se 
ha metido algo en la boca se le puede pedir que saque el objeto y, además, que se 
lave la boca con un antiséptico. 
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La supresión de la respuesta producida por el castigo depende en parte de 
ciertas características del estímulo aversivo. Los efectos de las distintas caracterís- 
ticas del acontecimiento aversivo se han investigado muy extensamente con la 
descarga. La conclusión general ha sido que cuanto más intensas y más largas sean 
las descargas, más eficaces resultan para suprimir las respuestas (véase las revi- 
siones de Azrin y Holz, 1966; Church, 1969; Walters y Grusec, 1977). La estirmu- 
lación aversiva de baja intensidad produce sólo una supresión moderada de las 
respuestas, y la alteración de la conducta puede desaparecer tras una exposición 
continuada al procedimiento de castigo (por ejemplo, Azrín, 1960). Por el contra- 
rio, si el estímulo aversivo es suficientemente intenso, las respuestas se pueden 
suprimir completamente durante un tiempo largo. En cierto experimento, por 
ejemplo, un castigo de alta intensidad suprimió completamente la respuesta ins- 
trumental durante seis días (Azrin, 1960). 

Otro factor muy importante del castigo es la forma en que se introduce el 
estímulo aversivo. Si se utiliza una descarga de alta intensidad cuando se intro- 
duce el procedimiento del castigo por primera vez, la respuesta instrumental se 
verá gravemente suprimida. Se producirá mucho menos supresión de la conducta 
si se utiliza inicialmente un castigo suave, y se va incrementando gradualmente la 
intensidad de la descarga a lo largo del entrenamiento de castigo (Azrin, Holz y 
Hake, 1963; Miller, 1960; véase también Banks, 1976). Así pues, los sujetos pue- 
den ser protegidos de los efectos del castigo intenso exponiéndoles primero a 
niveles bajos de descarga que no produzcan mucha supresión de la respuesta, 
Como debido a la baja intensidad de la descarga el castigo no altera demasiado las 
respuestas, los sujetos aprenden a seguir dando la respuesta instrumental en pre- 
sencia de la estimulación aversiva. Este aprendizaje se generaliza después a inten- 
sidades superiores de descarga, con el resultado de que la respuesta instrumental 
sigue dándose cuando se utiliza un castigo más aversivo. 

Los hallazgos anteriores sugieren que los sujetos adoptan un modo particular 
de responder durante su exposición inicial al castigo, y este tipo de conducta se 
generaliza a nuevas situaciones de castigo (Church, 1969). Esta idea tiene una 
implicación interesante. Supongamos que los sujetos se exponen primero a una 
descarga intensa que da como resultado un nivel muy bajo de respuestas. El modo 
de conducta adoptado durante la exposición inicial al castigo es una gran supre- 
sión de las respuestas. Si posteriormente se reduce la intensidad de la descarga, la 
elevada supresión de la conducta debería persistir, dando como resultado un nivel 
menor de respuesta que si se hubiera utilizado desde el principio una descarga 
suave. Raymond ha obtenido resultados de este tipo (informe en Church, 1969). 
Así pues, la exposición inicial a una suave estimulación aversiva que no altera 
mucho la conducta reduce los efectos de un posterior castigo intenso. Por el con- 
trario, la exposición inicial a una estimulación aversiva intensa aumenta los efec- 
tos supresores de un castigo suave posterior. 


La estimulación averstva contingente a la respuesta frente a la independiente 
de la respuesta. Otra importante variable que determina hasta qué punto la 
estimulación aversiva suprime la conducta es que el estímulo aversivo se presente 
contingente a una respuesta específica, o independientemente de la conducta. La 
estimulación aversiva independiente de la respuesta puede producir cierta supre- 
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sión de la conducta instrumental. Sin embargo, el hallazgo general es que se da 
' una supresión significativamente mayor de la conducta si la estimulación aversiva 
: se produce por la ejecución de la respuesta instrumental (por ejemplo, Azrin, 

1956; Camp, Raymond y Church, 1967; Frankel, 1975). En cierto experimento 

(Church, 1969), tres grupos de ratas fueron reforzados con comida por presionar 

una palanca de respuesta en un programa de intervalo variable de un minuto. A 
continación, mientras continuaba el reforzamiento con comida, se introdujo el 
castigo. Uno de los grupos nunca recibía descargas. El segundo grupo recibía 

estimulación aversiva independiente de la respuesta. Cada dos minutos se presen- 
taba una descarga breve, por regla general independiente de la presión de palanca 
de la rata. El tercer grupo recibía una estimulación aversiva contingente a la 
respuesta. La descarga breve estaba disponible, por regla general, cada dos minu- 
tos, pero se administraba a los sujetos sólo si daban una respuesta de presión de 
la palanca, inmediatamente después de la cual se administraba. Los resultados se 
resumen en la figura 9.12. Los datos se presentan en forma de razones de supre- 
sión, y comparan la tasa de respuesta durante la fase de castigo del experimento 
con la tasa observada antes de que se introdujera el castigo. Una puntuación de 
0,5 indica la no supresión de la respuesta y una puntuación de 0 indica una supre- 
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Fsgura 9.12.— Grado de supresión de la respuesta observado durante diez sesiones sucesivas. El grupo 

de control no recibió descargas, El grupo de no contingencia recibió descargas con independencia de su 

comportamiento, y el grupo de contingencia de la respuesta recibía descargas cuando respondía. 
(Según Church, 1969.) 
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sión completa de la conducta de presión de la palanca. Como se puede ver, las 
descargas independientes de la respuesta producían una supresión pequeña de las 
respuestas, que comenzaba a disiparse después de la tercera sesión. Por el contra- 
rio, las descargas contingentes a la respuesta producían una supresión fuerte y 
duradera de la presión de la palanca. Así pues, la estimulación aversiva producida 
por la respuesta fue mucho más eficaz para suprimir la conducta que la estimula- 
ción aversiva independiente de la respuesta. (Véase también Bolles, Holtz, Dunn 
y Hill, 1980). 


Los efectos de la demora en el castigo. En los procedimientos de castigo 
independiente de la respuesta, el estímulo aversivo puede ocurrir inmediatamente 
después de la respuesta instrumental en algunas ocasiones, y mucho tiempo des- 
pués de la respuesta en otras ocasiones. La investigación centrada del intervalo 
entre la conducta instrumental y la estimulación aversiva ha demostrado que esta 
variable influye enormemente en el grado de supresión de la respuesta. La conclu- 
sión general es que al aumentar el intervalo entre la respuesta instrumental y la 
administración del castigo se produce una supresión menor de la conducta (por 
ejemplo, Baron, 1965; Camp y otros, 1967). Esta relación es particularmente 
importante en los intentos de utilizar el castigo para modificar la conducta fuera 
del laboratorio. Se pueden producir retrasos inadvertidos si la respuesta no 
deseada no se detecta rápidamente, si se tarda en investigar quién tiene realmente 
la culpa del error, o si preparar el estímulo aversivo requiere tiempo. Ese retraso 
puede hacer que el castigo sea totalmente ineficaz para modificar la conducta 
indeseable. 


Los efectos de los programas de castigo. Exactamente del mismo modo que 
el reforzamiento no tenía que suministrarse cada vez que se produjera la res- 
puesta instrumental, el castigo puede también administrarse intermitentemente. 
Por ejemplo, en vez de castigar cada aparición de la respuesta instrumental, el 
castigo puede suministrarse después de un número fijo de respuestas. Ese proce- 
dimiento se llama «programa de castigo de razón fija». En cierto estudio de cas- 
tigo de razón fija (Azrin y otros, 1963) las palomas fueron primero reforzadas 
con comida en un programa de intervalo variable por picotear uma tecla de res- 
puesta. Cuando la conducta de picoteo de la tecla presentaba una tasa alta y esta- 
ble, se introducía el castigo. Se probaron varios procedimientos de castigo de 
razón fija mientras continuaba suministrándose el reforzamiento de comida por 
la conducta de picoteo. Los resultados están resumidos en la figura 9.13, Cuando 
todas las respuestas recibían descarga (RE 1 castigo), cesaba por completo el 
picoteo de la tecla. Con los otros programas de castigo, la tasa de respuestas 
dependía de la frecuencia del castigo. Los programas de razón fija más alta permi- 
tian más respuestas antes de la administración del castigo. Resulta poco sorpren- 
dente, por tanto, que aparecieran las tasas más altas de respuestas cuando se 
utilizaban los programas de castigo de razón fija más alta. Sin embargo, se 
observó todavía alguna supresión de la conducta cuando se administró la descarga 
sólo cada mil respuestas. 
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Figura 9.13.—Registro acumulativo del picoteo cuando la respuesta no era castigada y cuando era 

castigada de acuerdo a distintos programas de castigo de razón tija. Las marcas oblicuas indican la 

liberación del casrigo. La respuesta fue reforzada con un programa de intervalo variable 3 minutos. 
(Según Azrin, Holz y Hake, 1963.) 


Los efectos de los programas de reforzamiento positivo. Como ya adverti- 
mos antes, en la mayoría de los estudios de castigo la respuesta instrumental se 
mantiene gracias a un programa simultáneo de reforzamiento positivo, de forma 
que existe cierto nivel de respuesta susceptible de ser castigado. Por tanto, los 
efectos de un procedimiento de castigo están determinados en parte por este 
reforzamiento positivo. Cuando se mantiene la conducta mediante un programa 
de reforzamiento positivo de intervalo fijo o variable, el castigo produce un des- 
censo en la tasa total de respuesta. Sin embargo, no se altera la distribución 
temporal de la conducta. Es decir, durante el procedimiento de castigo el reforza- 
miento positivo de intervalo variable produce una tasa de respuesta disminuida, 
pero estable (véase figura 9.13), mientras que el reforzamiento positivo de inter- 
valo fijo produce el típico patrón de respuestas en festón (por ejemplo, Azrin y 
Holt, 1961). El resultado es considerablemente distinto si la conducta se mantiene 
con un programa de reforzamiento positivo de razón fija. Como ya advertimos en 
el capítulo 6, los programas de razón fija producen una pausa en las respuestas 
inmediatamente después del reforzamiento (la pausa postrreforzamiento), seguida 
de una tasa de respuestas alra y estable para completar el número de respuestas 
necesarias para el siguiente reforzamiento (la carrera de la razón). El castigo 
normalmente aumenta la duración de la pausa postrreforzamiento, pero tiene 
poco efecto sobre la carrera de la razón (Azrin, 1959). Las respuestas iniciales de 
una carrera de razón fija son mucho más susceptibles al castigo que las respuestas 
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posteriores. Así pues, la descarga administrada en los momentos iniciales de una 
carrera de razón aumenta la pausa postrreforzamiento más que la descarga admi- 
nistrada en los momentos finales de la carrera (Dardano y Sauerbrunn, 1964; 
véase también Church, 1969). Otro aspecto importante de los programas de 
reforzamiento positivo es la frecuencia con que se suministra el reforzamiento. 
Generalmente, el castigo tiene menos efecto sobre las respuestas instrumentales 
que producen un reforzamiento positivo más frecuente (por ejemplo, Church y 
Raymond, 1967). 


La disponibilidad de las respuestas alternativas para obtener reforzamiento 
positivo. En muchos experimentos, la respuesta castigada es también la única 
respuesta que el sujeto puede realizar para obtener un reforzamiento positivo, tal 
como comida, Al disminuir su tasa de respuestas, el sujeto hace que disminuya el 
número de bolitas de comida que recíbe. Por tanto, el sujeto se encuentra ante un 
conflicto entre suprimir su conducta para evitar el castigo y responder para obte- 
ner un reforzamiento positivo. Esta situación difícil no existe si se dispone de 
respuestas alternativas para obtener un reforzamiento positivo. En este caso, el 
sujeto puede dejar por completo de dar la respuesta castigada sin tener que 
renunciar al reforzamiento positivo. Como se podría esperar, la disponibilidad de 
una fuente alternativa de reforzamiento aumenta enormemente la supresión de 
las respuestas producida por el castigo. En un estudio, por ejemplo, fueron senta- 
dos dos hombres adultos enfrente de dos palancas de respuesta, y se reforzaba 
cualquier presión de la palanca con un cigarro en un programa de intervalo varia- 
ble (Herman y Azrin, 1964). Después de alcanzada una tasa estable de la con- 
ducta, la respuesta en una de las palancas producía un ruido desagradable y breve. 
En una de las situaciones experimentales, sólo estaba disponible una palanca 
durante la fase de castigo. En la otra situación, las dos palancas eran accesibles, y 
se castigaba la respuesta en una de ellas con el ruido fuerte. La figura 9.14 mues- 
tra los resultados. Cuando la respuesta castigada fue la única manera de obtener 
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cigarros, el castigo producía una supresión moderada de la conducta. Por el con- 
trario, cuando estaba disponible la respuesta alternativa, las respuestas en la 
palanca de castigo cesaban por completo. Así pues, la disponibilidad de una res- 
puesta alternativa para obtener reforzamiento positivo aumentó enormemente 
los efectos supresores del castigo. En otras situaciones se han obtenido resultados 
similares. Por ejemplo, es mucho menos probable que los niños castigados por 
jugar con ciertos juguetes jueguen con ellos si se les permite a cambio jugar con 
otros juguetes (Perry y Parke, 1975). 


Los efectos de un estímulo discriminativo para el castigo. Como ya vimos en 
el capítulo 8, si el reforzamiento positivo se entrega por responder en presencia 
de un estímulo discriminativo, pero no en su ausencia, el sujeto aprende a tes- 
ponder sólo cuando el estímulo está presente. Los efectos supresores del castigo 
también pueden ponerse bajo el control por un estímulo. Esto ocurre si la res- 
puesta se castiga en presencia de un estímulo discriminativo, pero no cuando el 
estímulo está ausente. A este procedimiento se le llama castigo discriminativo. 
Con una exposición continuada al estímulo discriminativo, los efectos supresores 
del castigo se limitan a la presencia del estímulo discriminativo. 

Én uno de los primeros experimentos de este tipo, Dinsmoor (1952) reforzó a 
unas ratas con comida en un programa de intervalo variable de dos minutos por 
presionar la palanca de respuesta. Después de estabilizarse las respuestas, se 
alternaban sucesivamente períodos de castigo de 5 minutos con períodos sin cas- 
tigo de 5 minutos. Durante los períodos de castigo, las luces de la cámara experi- 
mental se apagaban, y cada respuesta de presión de la palanca daba como resul- 
tado una descarga breve. Durante los períodos de seguridad, las luces se encendían 
y no se administraba ninguna descarga. (El reforzamiento con comida continuaba 
durante los períodos de castigo y los períodos de seguridad. Las ratas aprendían 
rápidamente a restringir sus respuestas a los períodos de seguridad.) Cuando las 
luces se apagaban, señal de que el procedimiento de castigo estaba funcionando, se 
suprimían las respuestas. Sin embargo, se restablecían las respuestas siempre que 
las luces volvían a encenderse, lo que señalaba que las respuestas no serían 
castigadas. 

El hecho de que los efectos de supresión del castigo puedan limitarse a la 
presencia de estímulos discriminativos es, a menudo, problemático para las apli- 
caciones del castigo. En muchas situaciones, la persona que administra el castigo 
sirve también como estímulo discriminativo para el castigo, con el resultado de 
que la conducta no deseada se suprime sólo mientras esa persona está presente. Si 
un profesor lleva una disciplina más estricta que otro, los niños aprenden a 
suprimir su conducta desmadrada en esa clase más que en las otras. Si uno de los 
padres es más estricto que el otro, los hijos se comportan mejor en presencia del 
padre más estricto. Un coche de la policía de tráfico es un estimulo discriminativo 
para el castigo por exceso de velocidad. Es más probable que los conductores 
obedezcan las normas sobre la velocidad en las zonas donde ven muchos coches 
de la policía de tráfico que en los tramos de carretera donde no patrulla ninguno. 


El castigo como señal para la disponibilidad del reforzamiento positivo. El 
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castigo no siempre suprime la conducta. De hecho, en algunas situaciones las 
personas parecen ir buscando el castigo. ¿Supone esto una contradicción con los 
mecanismos normales de conducta o puede explicarse esa conducta utilizando los 
principios explicados hasta ahora? Las pruebas experimentales sugieren que los 
mecanismos conductuales convencionales pueden igualmente llevar a esas conduc- 
tas anormales. La búsqueda del castigo puede aparecer en una situación en la que 
el reforzamiento positivo sólo está disponible cuando también se castiga la res- 
puesta instrumental. En tales circunstancias, el castigo puede convertirse en una 
señal, o estímulo discriminativo, para la disponibilidad del reforzamiento pos:- 
tivo. Si esto ocurre, el castigo, en vez de disminuir, aumenta la respuesta. 

En una desmostración de las propiedades estimulares discriminativas del cas- 
tigo, las palomas fueron primero adiestradas para picotear una tecla de respuesta 
y asi obtener el reforzamiento de comida en un programa de intervalo variable 
(Holz y Azrin, 1961). Cada respuesta era después castigada con una descarga de 
suavidad suficiente para reducir la tasa de respuestas en un 50 por 100, aproxt- 
madamente. En la siguiente fase del experimento, los períodos en los que funcio- 
naba el procedimiento de castigo se alternaban con períodos en los que no se 
programaba castigo. Además, la respuesta de picoteo se reforzaba con comida sólo 
durante los períodos de castigo. Los períodos de seguridad y los de castigo no se 
señalaban con un estímulo exteroceptivo, tales como una luz o un tono. Por tanto, 
la única manera que tenían los sujetos de saber si el reforzamiento estaba dispo- 
nible consistía en comprobar si eran castigados por picotear. En esas circunstan- 
cias se producían tasas más altas de pícoteo durante los períodos de castigo que 
durante los períodos de seguridad. El castigo se convertía en un estímulo discri- 
minativo para el reforzamiento con comida. 


Otros ejemplos de conducta autopunitiva. La conducta autopunitiva resulta 
de gran interés porque presenta muy diversas formas en la patología de la con- 
ducta humana y, a veces, está sumamente ritualizada. En Europa, por ejemplo, 
durante la Edad Media existían flagelantes que viajaban de acá para allá azotán- 
dose unos a otros para purgarse de los pecados. 

Hacer del castigo un estímulo discriminativo para el reforzamiento positivo es 
un modo de crear conducta autopunitiva. La conducta autopunitiva puede también 
ser el resultado de un entrenamiento de escape anterior. Este fenómeno, a veces 
llamado conducta del círculo vicioso, ha sido extemsamente investigado con 
ratas en situaciones de corredor. En un experimento típico, se somete a los ani- 
males primero a un entrenamiento de escape en el que todo el corredor está 
electrificado y tienen que correr a lo largo del pasillo para escapar de la descarga y 
alcanzar la caja meta de seguridad. Después de que los sujetos han aprendido la 
respuesta de escape del pasillo, se introduce un procedimiento de extinción para 
los sujetos del grupo de control; la descarga ya mo se presenta más en ningún 
segmento del corredor. Para los sujetos experimentales, una porción del corredor 
(por ejemplo, el último tercio) sigue electrificado. Asi, los sujetos experimentales 
se encuentran con la descarga si corren durante la extinción, mientras que los 
sujetos de control no reciben el castigo. El hallazgo más notable es que en los 
sujetos experimentales el castigo aumenta la resistencia a la extinción de la res- 
puesta de correr. En vez de suprimir la conducta, el castigo de una conducta de 
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escape condicionada facilita las respuestas. (Para una discusión más extensa de 
este fenómeno, véase Brown, 1969; Brown y Cunningham, 1981; Melvin, 1971.) 


Las limitaciones de la respuesta para la eficacia del castigo. La conducta de 
círculo vicioso descrita antes ilustra la resistencia al castigo de una respuesta 
defensiva adquirida (una respuesta condicionada de escape). Otros estudios han 
probado que las respuestas defensivas no aprendidas o innatas son también de 
alguna manera resistentes al castigo. Shettleworth (1978a, 1981), por ejemplo, 
investigó la susceptibilidad al castigo de varios patrones de respuesta en hámsters 
y encontró que el erigirse (ponerse sobre las patas traseras sin tocar la pared de la 
cámara experimental) era sigoificativamente menos susceptible al castigo que 
escarbar (movimientos rápidos de las patas delanteras contra una de las paredes 
de la cámara experimental, en un movimiento parecido a excavar). Esta diferencia 
parece deberse al hecho de que al contrario que escarbar, erigirse sobre las patas 
traseras es una conducta defensiva innata en los hámsters, y, por tanto, aumenta 
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APARTADO 9.2 Cuando el castigo no funciona 


A veces se lleva a los niños a un terapeuta porque no se puede controlar su conducra. 
Un ejemplo típico es aquel en el que un niño es revoltoso y no responde a las prácticas 
disciplinarias de los padres o de los profesores. incluso el castigo, utilizado como último 
recurso, no funciona. Los padres o profesores se quejan de que la conducta del niño no 
hace más que empeorar. No es raro que los niños con un problema de este tipo sean 
diagnosticados como hiperactivos o emocionalmente alterados. Esas etiquetas indican que 
hay en el niño algo fundamentalmente malo. Los terapeutas de conducta, sin embargo, han 
hallado que en algunos casos el problema puede ser nada más que el resultado de una 
disciplina mal manejada. Los padres o los profesores pueden haber establecido de forma 
inadvertida el castigo como un estímulo discriminativo para el reforzamiento positivo. En 
lugar de hacer que descienda una conducta no deseada, el castigo la aumenta. ¿Cómo puede 
ocurrir esto? 

Vamos a tomar la situación hipotética de Juan, que vive en una casa con unos padres 
muy ocupados. Juan, como la mayoría de los niños, es bastante activo. Si está jugando 
tranquilamente en su habitación es muy probable que los padres lo ignoren y se ocupen de 
sus propias actividades. Por el contrario, si Juan sé comporta mal o demanda cosas, los 
padres se ven forzados a atenderle. Puede que los padres presten atención a Juan sólo 
cuando se comporta ral o pide algo. En el momento en que deja de ser un problema, los 
padres se sienten aliviados de tener un momento de paz. Así, más que reforzar la conducta 
pacífica o cooperadora, puede que los padres ignoren en esos momentos 4 Juan. Tenemos 
entonces un circulo vicioso. Cuanto peor se porta Juan, menos atención se presta a la 
conducta que no altera la tranquilidad, porque los padres tratan de disfrutar los momentos 
de quietud en los que tienen oportunidad de hacer alguna actividad propia. El mal compor- 
tamiento se convierte en el medio principal de obtener atención. Los castigos y reprimen- 
das que conlleva la conducta señalan al niño que los padres le cuidan y atienden. 

En la actualidad, el terapeuta no tiene la oportunidad de observar cómo se originan los 
problemas de esta clase. La hipótesis de que el castigo haya adquirido un valor discrimina- 
tivo será confirmada o rebatida según los resultados de los intentos de cambiar la situación. 
La hipótesis sugiere que si se cambian los patrones de atención, el problema de conducra 
de Juan puede mirigarse. Los psicólogos clínicos enseñan a menudo a Jos padres la forma 
de atender las actividades adecuadas y constructivas y a utilizar el castigo con la menor 
atención posible. En muchos casos sobreviene una mejoría espectacular cuando los padres 
son capaces de reforzar posirivamente la conducta cooperadora por medio de la arención, y 
de ignorar lo más posible las conductas molesras. 
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con las descargas independientes de las respuestas. (Para otros ejemplos de resis- 
tencia al castigo de la conducta defensiva, véase Melvin y Ervey, 1973; Walters y 
Glazer, 1971.) 


El castigo y la redistribución de la respuesta, En el capítulo 7 discutimos 
cómo el reforzamiento de una respuesta concreta puede originar una reorganiza- 
ción o redistribución de todo el repertorio conductual del organismo. El reforza- 
miento con frecuencia aumenta la futura probabilidad de la respuesta reforzada, y 
disminuye algunas otras actividades que el sujeto podría realizar. El castigo pro- 
duce igualmente una redistribución de la conducta del sujeto. La supresión de la 
respuesta castigada puede ir acompañada por aumentos en algunas otras activida- 
des, así como, posiblemente, de descensos en ciertas respuestas no castigadas. En 
un experimento, por ejemplo, a unas ratas sedientas se les dejó que accedieran a 
una rueda giratoria y al mismo tiempo bebieran de un tubo (Dunham, 1972). A 
continuación, las ratas eran castigadas por beber. Como era de esperar, el castigo 
suprimía la respuesta de beber. Sin embargo, el castigo también aumentaba la 
cantidad de tiempo que dedicaban las ratas a correr en la rueda. Esos aumentos 
compensatorios de las respuestas no castigadas se han observado en una gran 
variedad de situaciones. Resulta habitual que no todas las respuestas no castigadas 
del animal aumenten cuando se selecciona una respuesta para el castigo. Más aún, 
a menudo es sólo la más probable de las respuestas no castigadas la que se ve 
incrementada (Dunham, 1971, 1978). La reorganización del perfil de respuestas 
del sujeto puede implicar también descensos en la tasa de las respuestas no casti- 
gadas. Por ejemplo, en los conejillos de indias el castigo de ciertas respuestas 
(sentarse sobre las paras traseras, escarbar o lavarse la cara) da lugar a un 
aumento en la paralización y en la conducta de andar-olisquear, así como un 
descenso en las conductas no castigadas de roer y apoyar las patas en la pared 
(Shettleworth, 1978a). La investigación acerca de tales reorganizaciones de la 
conducta está aún en mantillas, y no aparecen del todo claros los mecanismos que 
determinan los resultados que se obtienen en las situaciones de castigo (véase 
Dunbarm, 1978; Shettleworth, 1978a). 


Teorías del castigo 


A diferencia del estudio sobre la conducta de evitación, las investigaciones 
sobre el castigo, en general, no han estado motivadas por consideraciones teóri- 
cas. La mayor parte de las pruebas disponibles sobre los efectos del castigo han 
sido producto de curiosidad empírica. Los investigadores se han interesado por 


averiguar de qué forma el castigo está influido por diversas manipulaciones antes 


que por comprobar ciertas formulaciones teóricas. De hecho, existen pocas teorías 
sistemáticas del castigo, y la mayoría de ellas se formularon hace más de treinta 
años. Vamos a describir tres de las teorías más sobresalientes. 


Teoría del castigo de la respuesta emocional condicionada. Una de las pri- 
meras teorías del castigo fue propuesta por Estes (1944) y se basa en la observa- 
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ción de Estes y Skinner (1941) de que un estímulo condicionado que se ha empa- 
rejado con una descarga suprime la realización de la conducta instrumental 
reforzada con comida. Ya discutimos antes en este capítulo, así como en los capí- 
tulos 3 y 5, el procedimiento de supresión condicionada. El experimento típico de 
supresión condicionada consiste en condicionar primero a los animales a dar una 

respuesta instrumental, tal como presionar una palanca para obtener un reforza- 
miento de comida. Después se lleva a cabo un condicionamiento clásico en el que 
un EC (un sonido o una luz, por ejemplo) se empareja con una descarga breve. A 
continuación se presenta el estimulo aversivo condicionado mientras se permite 
al animal que presione la palanca para obtener el reforzamiento de comida. Lo 
que suele producirse es una alteración de las respuestas durante las presentaciones 
del EC. Originariamente se interpretó que esta supresión de la respuesta provenía 
de las respuestas competitivas provocadas por el EC. La idea básica era que el 
estímulo condicionado provocaba ciertas respuestas emocionales (como la parali- 
zación) por el hecho de estar emparejadas con la descarga. Esas respuestas emo- 
cionales condicionadas eran, presumiblemente, incompatibles con la respuesta de 
presión de la palanca (la rata mo podía quedarse paralizada y al mismo tiempo 
presionar la palanca). Por tanto, la tasa de presión de la palanca se suprimía 
durante las presentaciones del EC. 

Estes (1944) propuso que el castigo suprime la conducta a través del mismo 
mecanismo que produce la supresión condicionada ante un EC emparejado con la 
descarga. Sin embargo, a diferencia del experimento de supresión condicionada, 
los procedimientos de castigo no suelen incluir un EC explícito que señale la 
administración inminente de la descarga. Estes sugirió que cumplen esta función 
los diversos estímulos que el sujeto experimenta inmediatamente antes de dar la 
respuesta castigada. Por ejemplo, justo antes de que la rata presione la palanca, 
experimenta claves visuales y otras claves espaciales que existen cerca de la 
palanca, las claves táctiles de la palanca, y, quizá, los estímulos propioceptivos 
provenientes de la postura que adopta cuando está a punto de presionar la 
palanca. Cuando se castiga la respuesta, todos esos estimulos se emparejan con la 
descarga. Mediante la repetición del episodio de castigo, los diversos estímulos 
previos a la respuesta quedan fuertemente condicionados a la descarga. Como 
estos estímulos adquieren propiedades aversivas condicionadas, provocarán res- 
puestas emocionales condicionadas que son incompatibles con la conducta casti- 
gada. De esta forma llega a suprimirse la respuesta castigada. 

La teoría de la respuesta emocional condicionada puede explicar muchos 
hechos sobre el castigo. Por ejemplo, el hecho de que las descargas más intensas y 
de mayor duración produzcan una supresión mayor de la respuesta puede expli- 
carse asumiendo que los estímulos condicionados por esos hechos aversivos pro- 
vocan respuestas emocionales condicionadas más intensas. La teoría puede expli- 
car también por qué una estimulación aversiva contingente a la respuesta produce 
más supresión de la respuesta que una administración de la descarga indepen- 
diente de la respuesta. Si la descarga está producida por la respuesta instrumental, 
es más probable que los estimulos que se condicionan a la descarga queden estre- 
chamente relacionados con la ejecución de esa conducta. Por tanto, es más proba- 
ble que las respuestas emocionales condicionadas interfieran con las respuestas 
castigadas. 

En una nueva formulación de la teoría de la respuesta emocional condicio- 
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nada, Estes (1969) ha propuesto una explicación alternativa de los mecanismos de 
la supresión condicionada. La nueva formulación puede ser parafraseada en tér- 
minos emocionales. La idea básica es que un estímulo condicionado a la descarga 
altera las respuestas reforzadas con comida porque evoca un estado emocional o 
motivacional (digamos, miedo) que es incompatible con la motivación que man- 
tiene la conducta reforzada con comida. Se supone que el estímulo condicionado a 
la descarga inhibe la motivación para responder basada en el reforzamiento posi- 
tivo, Esta revisión es compatible con la moderna teoría de los dos procesos que 
vamos a discutir en el capítulo 10. Como veremos, la moderna teoría de los dos 
procesos sostiene también que los estados motivacionales provocados por un 


estímulo condicionado de forma clásica pueden interactuar con, o influir en el 


estado motivacional originado por un procedimiento de condicionamiento instru- 
mental. 


Teoría del castigo como evitación. Una alternativa ingeniosa a la teoría de la 
respuesta emocional condicionada considera el castigo como una forma de con- 
ducta de evitación. Esta teoría está relacionada muy estrechamente con Dinsmoor 
(1954, 1977) y sigue la tradición de la teoría de la evitación de los dos procesos. 
Dinsmoor aceptó la idea de que los estimulos que señalan la conveniencia de una 
respuesta instrumental concreta quedan condicionados por el estímulo aversivo 
cuando se castiga esa respuesta, Así pues, supuso que esos estímulos adquirían 
propiedades aversivas condicionadas de la misma manera que ocurría en la teoría 
de la respuesta emocional condicionada. Sin embargo, Dinsmoor agregó un 
segundo proceso al mecanismo del castigo. Propuso que los sujetos aprenden a 
escapar de los estímulos aversivos condicionados relacionados con la respuesta 
castigada dedicándose a alguna otra conducta que es incompatible con la actividad 
castigada. Ya que esa otra conducta es incompatible con la respuesta castigada, la 
realización de la actividad alternativa da lugar a una supresión de la conducta 
castigada. Ási pues, la teoría de la evitación explica el castigo en términos de la 
adquisición de respuestas de evitación incompatibles. 

La teoría del castigo como evitación es una propuesta ingeniosa. Sugiere que 
todos los cambios producidos por el condicionamiento instrumental aversivo, bien 
sea en forma de aumentos o descensos en la probabilidad de la respuesta, pueden 
explicarse mediante los mismos mecanismos de fortalecimiento de la respuesta. 
La supresión de la conducta no se considera un reflejo del debilitamiento de la 
respuesta castigada. Antes bien, se explica en términos del fortalecimiento de 
aquellas respuestas competitivas que evitan eficazmente la estimulación aversiva. 
Así pues, se utiliza un único marco teórico para analizar los resultados de los dos 
procedimientos, el de la evitación y el del castigo. Tal economía se ha considerado 
siempre deseable en las explicaciones científicas. | 

A pesar de lo inteligente y parca que es la teoría del castigo como evitación, 
no ha sido uniformemente aplaudida. En primer lugar, porque explica el castigo 
utilizando los mismos mecanismos que la evitación, y todos los problemas teóri- 
cos que han resultado molestos en el análisis de la conducta de evitación se con- 
vierten en problemas que tienen que ser resueltos también en el análisis del 
castigo. Otro desafío a la teoría es que sus elementos esenciales no están estable- 
cidos de una forma tal que los haga fácilmente accesibles a la verificación experi- 
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mental (Rachlin y Herrnstein, 1969; Schuster y Rachlin, 1968). Los estímulos que 
supuestamente adquieren propiedades aversivas condicionadas no están bajo el 
control directo del experimentador. Antes bien, son hechos que suponemos que el 
sujeto experimenta cuando está a punto de dar la respuesta castigada. De forma 
semejante, las actividades que el sujeto aprende a realizar para no tener que dar la 
respuesta castigada están mal especificadas. La teoría no nos dice cuáles serán esas 
respuestas en una situación determinada, o de qué forma deberíamos buscarlas. La 
teoría también suministra una explicación más bien molesta de los resultados de 
los experimentos con programas concurrentes encadenados de castigo (por ejem- 
plo, Schuster y Rachlin, 1968). Sin embargo, la teoría sigue siendo compatible con 
la mayoría de los hechos implicados en el castigo, quizá porque está establecida de 
tal forma que hace difícil su comprobación experimental. 


El castigo y la ley del efecto negativo. La tercera y última hipótesis sobre el 
castigo que vamos a considerar es, además, la más antigua. Thorndike (1911) 
propuso originariamente que el reforzamiento positivo y el castigo implican pro- 
cesos simétricamente opuestos. Ásí como el reforzamiento positivo fortalece la 
conducta, el castigo la debilita. En años posteriores, Thorndike abandonó la idea 
de que el castigo debilita la conducta porque en sus experimentos no pudo hallar 
pruebas que apoyaran esta idea (Thorndike, 1932). Sin embargo, la creencia de 
que existe una ley del efecto negativo que es comparable, pero Opuesta, a la ya 
familiar ley del efecto positivo ha conseguido la aceptación de algunos investiga- 
dores (por ejemplo, Azrin y Holz, 1966; Rachlin y Herrnstein, 1969). 

Premack y sus colaboradores han desarrollado un enfoque del análisis de la ley 
del efecto negativo. Como ya discutimos en el capítulo 7, Premack propuso que el 
reforzamiento positivo aparece cuando la oportunidad de participar en una activi- 
dad altamente valorada depende de la realización previa de una actividad de valor 
más bajo. El sujeto distribuye el tiempo de acuerdo con esa restricción. La res- 
puesta instrumental se ve aumentada por la contingencia y la conducta reforzante 
se ve disminuida. Según Premack, la introducción del castigo invierte esta rela- 
ción. Ahora, se hace que una actividad de valor bajo sea contingente a la realiza- 
ción de una conducta de valor superior. Someterse a una descarga, por ejemplo, 
tiene mucha menos probabilidad que presionar una palanca para obtener comida. 
Por tanto, la descarga puede castigar la presión de la palanca. 

Premack y sus colaboradores probaron esta idea sobre el castigo usando una 
rueda giratoria que se movía impulsada por un motor y equipada con un tubo 
para beber. En un experimento (Weisman y Premack, 1966), unas ratas fueron 
privadas de agua, de forma que beber era más probable que correr. Después se 
introdujo un procedimiento de castigo en el que tras un rato bebiendo venía un 
período de carrera forzada. (El motor adaptado a la rueda giratoria continuaba 
dando vuetas para forzar a la rata a correr.) En esas condiciones beber era supri- 
mido por correr. Así se obtenía un efecto de castigo. Este experimento y otros 
(véase Premack, 1971a) ilustran que los efectos del castigo por carrera forzosa 
eran similares a los de la descarga. Los estudios de Premack y sus colaboradores 
ilustran también lo comparables que son el reforzamiento y el castigo. En el 
experimento de Weisman-Premack, la misma contingencia (correr después de 
beber) producía efectos opuestos según los valores relativos del correr y el beber. 
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Cuando correr se hacía más probable que beber (no privando por más tiempo de - 
agua a las ratas), correr reforzaba el beber. Así pues, correr después de beber 
castigaba o reforzaba el beber, según tuviera el correr menos o más valor que el 
beber. 

Con un procedimiento de reforzamiento se aumenta la respuesta instrumental 
y se disminuye la respuesta reforzante respecto a la situación de línea de base 
libre de respuesta. Con un procedimiento de castigo la respuesta instrumental 
disminuye y aumenta la respuesta reforzante o de castigo en relación con las 
condiciones de línea de base. Por otra parte, en ambos casos la respuesta que 
aumenta es la conducta de bajo valor y la que disminuye es la de alto valor. Desde 
este punto de vista, los procedimientos de reforzamiento y castigo producen los 
mismos efectos. 

En el aspecto operativo, sólo hay una diferencia significativa. En el castigo el 
sujeto se ve forzado a tomar parte en una actividad de valor inferior. Las ratas no 
suelen aplicarse a sí mismas descargas eléctricas mi correr más de lo que quieren. 
Con el reforzamiento el sujeto es «inducido» por la contingencia misma a partici- 
par en una actividad de valor inferior. 

La semejanza entre reforzamiento y castigo que se ha descrito arriba se com- 
probó con un interesante experimento con niños que se centraba en la conducta 
de jugar con juguetes (Burkhard, Rachlin y Schrader, 1978). Durante la línea de 
base se observó a unos nifios mientras jugaban con tres juguetes. Los juguetes se 
clasificaron como alto, medio y bajo según el tiempo que los niños dedicaban a 
cada uno. Los niños fueron asignados a grupos de reforzamiento y de castigo. Al 
grupo de reforzamiento sólo se le permitía jugar 1 minuto con el juguete clasifi- 
cado como alto, después de haber jugado 1 minuto con el juguete clasificado como 
bajo. En el grupo de castigo se requería que jugaran 1 minuto con el juguete 
clasificado bajo, después de 1 minuto con el juguete clasificado alto. En ambos 
casos el juguete medio proporcionaba una actividad de fondo y podía usarse 
libremente. Si la hipótesis del castigo de Premack es correcta, los procedimientos 
de reforzamiento y castigo deberían producir la misma distribución del tiempo 
entre los tres juguetes. Este fue, de hecho, el resultado. Los grupos de reforza- 
miento y de castigo resultaban indistinguibles en cuanto al tiempo que termina- 
ban jugando con cada juguete. En los dos grupos el juego con el juguete clasificado 
alto aumentaba, y el juego con el juguete clasificado bajo disminuía en niveles 
comparables. 

Las investigaciones en la línea que propuso Premack continúan. Como en el 
caso del reforzamiento positivo, estos trabajos sugieren que el castigo impone una 
restricción contra la cual la conducta se tiene que ajustar. La ley del efecto nega- 
tivo, a la luz de este enfoque, establece la forma en que cambia la conducta some- 
tida a esas restricciones: una actividad de bajo valor produce un descenso en una 
actividad de valor superior. Los teóricos de mentalidad económica proponen, 
como en el caso del reforzamiento positivo (véase capítulo 7), que el sujeto res- 
ponde para optimizar el valor total. El proceso de optimización, con ambos pro- 
cesos (castigo y reforzamiento), supone un aumento en la actividad de valor bajo 
que se contrarresta con un descenso en la actividad de valor alto, y puede tener 
también efectos en otras conductas. 
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El uso del castigo fuera del laboratorio 


En ninguna parte existe más controversia sobre la aplicación de los principios 
de aprendizaje y de condicionamiento como en la aplicación de los procedimien- 
tos de control aversivo. Los libros de orientación a los padres sobre disciplina no 
se ponen de acuerdo en si el castigo es útil o si no se debería utilizar en absoluto; 
continúa en pleno vigor la controversia tanto en los tribunales como en los conse- 
jos escolares sobre si el castigo puede ser usado por los profesores en las clases y 
por los terapeutas en los hospitales. A lo largo de este siglo se ha debatido mucho 
sobre el uso adecuado del control aversivo en el sistema de justicia criminal. ¿Cuál 
es la base de todo este debate? En un examen más atento vemos que los debates 
se centran tanto en los problemas prácticos que implica la aplicación de los pro- 
cedimientos de control aversivo, como en las cuestiones morales que surgen 
cuando una persona hace daño a otra, 


Problemas prácticos en el uso del castigo. Un argumento que se ha utilizado 
contra el uso del castigo es que no funciona. Sin embargo, esto es así únicamente 
si el castigo se utiliza de forma no apropiada. La revisión anterior de las conclu- 
siones de distintas investigaciones sugiere mumerosas formas de alcanzar la 
máxima eficacia en el castigo. El castigo debería ser contingente a la respuesta, y 
debería administrarse inmediatamente después de la respuesta no deseada, El 
estimulo aversivo debería ser de intensidad suficiente para suprimir la conducta 
desde el comienzo del entrenamiento de castigo, de forma que el sujeto no 
aprenda a seguir respondiendo a pesar del castigo. El castigo no debería adminis- 
trarse de forma intermitente, y el reforzamiento positivo de la respuesta no 
deseada debería bajar al mínimo; el reforzamiento positivo debería suministrarse 
a las respuestas alternativas antes que a la respuesta castigada. Los procedirnien- 
tos de castigo deberían evitar proporcionar estímulos discriminativos para el cas- 
tigo y hacer del castigo un estímulo discriminativo para el reforzamiento positivo. 
Por último, deberían hacerse esfuerzos para no condicionar la respuesta castigada 
como una conducta defensiva previa a la introducción del castigo. Las aplicaciones 
del castigo fuera del laboratorio violan, a menudo, alguna de estas prescripciones 
para un uso eficaz. 

Algunas críticas al castigo se basan en que produce una supresión total de la 
conducta del individuo más que la mera supresión de la respuesta castigada. 
Algunas personas afirman que al utilizar el castigo como medio de disciplinar a 
los niños simplemente se sofoca la actividad normal del niño. La investigación 
reciente, sin embargo, no apoya esta afirmación. En una parte anterior del capí- 
tulo revisamos las pruebas de que el castigo suprime realmente respuestas concre- 
tas. Además, sabemos que el castigo leva a una reorganización de la conducta que, 
a menudo, incluye un aumento de ciertas respuestas no castigadas (por ejemplo, 
Dunham, 1978). Puede darse también alguna supresión de otras respuestas no 
castigadas. Sin embargo, este descenso rara vez es tan grande como la supresión 
de la respuesta castigada (por ejemplo, Church, Wooten y Matthews, 1970). 

Otra reserva sobre el uso del castigo es que tiene unos efectos secundarios 
indeseables, tales como la agresión, el escape y la hostilidad. A algunos padres y 
profesores no les gusta utilizar el castigo porque el niño puede volverse hostil, 
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coger rabietas, intentar escapar, o llegar a odíar a los padres, a los profesores o al 
colegio. El adulto puede encontrarse con que los efectos secundarios son mucho 
más difíciles de manejar que las respuestas originales no deseadas. Los que abo- 
gan por la reforma de la justicia criminal a menudo citan el hecho de que una 
sentencia de prisión, con frecuencia, no produce en el criminal la reforma que se 
esperaba. Antes bien, el convicto puede volver a la sociedad con más hostilidad 
que antes. Esta hostilidad, junto con nuevas habilidades antisociales aprendidas de 
otros prisioneros pueden ser más perjudiciales a largo plazo para la sociedad que 
las trasgresiones originales. 

Las investigaciones de laboratorio han proporcionado datos sobre los efectos 
secundarios no deseados del castigo. Varios investigadores han estudiado las con- 
ductas provocadas por los hechos aversivos que se utilizan en los procedimientos 
de castigo. La descarga, por ejemplo, puede provocar agresión. Si se coloca a dos 
animales juntos en una cámara experimental y se les administra una descarga, 
adoptan una postura de ataque y de lucha mientras dura la descarga (por ejemplo, 
Ulrich, Hutchinson y Azrin, 1965). Igualmente, los monos muerden un tubo de 
goma (Hutchinson, Azrin y Hake, 1966) y los humanos aprietan la mandíbula 
cuando son estimulados aversivamente. Estas respuestas son provocadas por la 
presentación de un estímulo aversivo contingente a una respuesta instrumental, 
como ocurre en el caso del castigo. Por tanto, no es sorprendente que los niños se 
revuelvan contra los padres tras un castigo o que un prisionero empiece a lanzar 
objetos que tenga a mano para agredir. nda ] 

El castigo puede motivar también el escape de la situación de castigo. Los 
experimentos de laboratorio han mostrado que las ratas y las palomas aprenden 
una respuesta instrumental cuya única consecuencia es escapar de la situación de 
castigo (por ejemplo, Azrin, Hake, Holz y Hutchinson, 1965; Hearst y Sidman, 
1961). Fuera del laboratorio el escape puede presentar serios problemas porque el 
fin de la aplicación de un castigo rara vez consiste en expulsar al individuo de una 
situación. Cuando castigamos a un niño por no realizar las tareas de la casa o los 
deberes del colegio, no queremos que se marche de casa, Cuando castigamos a un 
adolescente por fumar en el colegio, no pretendemos que el estudiante se vaya del 
colegio ni que escape de la situación tomando drogas psicoactivas. 

Otro efecto secundario no deseable del castigo es que las propiedades moti- 
vantes o elicitantes del estímulo aversivo pueden quedar condicionadas a otros 
estímulos que están presentes en la situación a través del condicionamiento clá- 
sico. Así, la persona que administra el castigo puede quedar asociada a la estimu- 
lación aversiva. Sabemos que los estímulos condicionados por la descarga y Otros 
ECs aversivos adquieren propiedades aversivas. A través de este mecanismo, al 
sujeto castigado puede llegar a desagradarle el profesor, el compañero o el padre 
que administró el castigo. 

Una última dificultad es la que suponen los efectos sobre la persona que 
administra el castigo. Administrar un castigo va a menudo acompañado de ciertas 
reacciones en la persona que lo realiza. Los padres se disgustan o se enfadan por 
las actividades no deseadas de sus hijos. Es raro el padre o profesor que adminis- 
tra el castigo de forma puramente imparcial. La administración de un castigo 
puede verse en muchos casos como un acto agresivo provocado por la conducta 
revoltosa de un niño. Como tal, se puede perder el control de él. El abuso de los 
niños, los adultos maltratados, la brutalidad de los guardias y los presos en las 
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prisiones son, todos ellos, ejemplos en los que se ha perdido el control del castigo. 
Desgraciadamente, son problemas serios de muestra sociedad que no entendemos 
muy bien o que todavía no sabemos muy bien cómo tratar. 


Consideraciones morales. Se puede decir de modo general que a la mayoría 
de las personas no les gusta que las castiguen. Además, al menos en los momen- 
tos de más tranquilidad, no nos gusta infligir castigos a los demás. A los padres 
no les gusta ver a sus hijos tristes, los profesores no quieren que los alumnos 
tengan un mal concepto de ellos o que niños inevitablemente descarriados los 
vean como «verdugos», y los jueces no quieren ver la vida humana malgastada de 
forma improductiva en la cárcel. La utilización del castigo nos recuerda el lado 
más bajo de la naturaleza humana, que se revela en la tortura, en los campos de 
concentración, etcétera. Sin embargo, existen casos en los que infligimos un daño 
a propósito para prevenir un daño mayor. No creemos ser unos verdugos si 
recomendamos una visita al dentista, una inyección o una cucharada de aceite de 
ricino. No consideramos esas prácticas inmorales, porque aun cuando producen 
desagrado, se realizan persiguiendo un bien mayor. 

A veces se utiliza el mismo razonamiento para infligir el castigo. Muchos 
padres no sienten que actúan mal sí dan un manotazo a su pequeño por acercarse 
2 un horno caliente o a un cable eléctrico. La seguridad general del niño es lo que 
está en cuestión, y en comparación, el dolor de una torta es insignificante. La 
ventaja tremenda que posee el castigo respecto a Otros procedimientos conductua- 
les es que a veces la supresión de la conducta es inmediata cuando el procedi- 
miento se aplica adecuadamente. Con métodos alternativos, tales como la extin- 
ción, la supresión de la respuesta suele tardar más tiempo. Para asegurarse de que 
el pequeño no se va a quemar con el horno, por ejemplo, la supresión inmediata 
de la conducta es de la mayor importancia. 

El dilema moral del castigo puede estar ilustrado en la controversia que rodea 
al uso del castigo con niños autistas. Los niños autistas presentan con frecuencia 
conductas autopunitivas, tales como dar golpes con su cabeza contra la pared, 
tirarse de los pelos o golpearse. Á veces su conducta autopunitiva es tan grave que 
se les tiene que atar las manos para impedir que se hagan daño. En casos extre- 
mos, hay que atar las manos y los pies del niño a las esquinas de la cama. Lovaas y 
sus colaboradores estudiaron la conducta autopunitiva en muchos niños (véase 
Carr y Lovaas, 1983; Lovaas y Newsom, 1976). Llegaron a la conclusión de que, 
en los casos que habían observado, la conducta se había mantenido en gran parte 
por la atención dispensada a los niños que se infligían daños a sí mismos. Al 
intentar los cuidadores que los niños se calmasen reforzaban sin darse cuenta las 
respuestas autolesivas. Cuando los cuidadores ignoraban la conducta, las respues- 
tas finalmente se extinguían. Sin embargo, el periodo de extinción podía ser largo 
y a veces comenzaba con un aumento inicial del daño autonflingido. En algunos 
casos, permitir que el niño pasara por todo el proceso de extinción habría sido 
muy peligroso. El niño podría llegar a herirse gravemente. Lovaas y sus colabora- 
dores recurrieron de nuevo al castigo para tratar los casos graves. Cada ejemplo 
de automutilación iba seguido de una torta o de una descarga eléctrica breve. El 
resultado era una rápida supresión de la conducta autolesiva. 

Naturalmente, los procedimientos de castigo que se utilizaron encontraron 
objeciones. Es común la creencia de que pegar O aplicar descargas eléctricas a 
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niños que consideramos gravemente enfermos es malo. Sin embargo, la investiga- 
ción parece mostrar que nuestro amor y atención sólo sirve para fomentar la 
conducta autolesiva. Lovaas y sus colaboradores sugieren que el uso del castigo 
con niños autistas es un caso de daño pequeño infligido por un bien mayor del 
niño. Diez o doce descargas de un segundo pueden eliminar la conducta autolesiva 
que de otro modo podría dar lugar a morderse los dedos, sacarse los ojos, rom- 
perse la nariz, etcétera. La supresión de esas conductas autolesivas supone sólo 
un paso dentro del procedimiento de tratamiento. El hecho de que el niño ya no 
presente esa conducta autodestructiva compulsiva permite al terapeuta establecer, 
a través del amor y el afecto, conductas más aceptadas socialmente. Sin embargo, 
la investigación todavía no ha dilucidado todos los aspectos de los procedimientos 
de castigo. Existen muchas cuestiones sin responder sobre los efectos a largo 
plazo del castigo de la autolesión y los efectos de este castigo sobre otras conduc- 
tas. Esas cuestiones tienen que responderse antes de tomar una decisión total- 
mente documentada sobre la terapia a elegir. 

Aunque en ciertas situaciones el castigo puede ser eficaz, debe usarse con gran 
cuidado. Los problemas que acarrea el uso del castigo son evidentes. El castigo no 
debería utilizarse de forma indiscriminada. Sin embargo, cuando se usa de forma 
adecuada en una situación justificada, el castigo puede ser una técnica muy útil 
para la supresión de las actividades no deseadas. 
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TABLA 10.2. Efectos de los estímulos clásicamente condicionados en la tasa 
de la respuesta instrumental 


El aversivo El apetitivo 


Programa EC+ EC— EC+ EC — 
instrumental (miedo) (alivio) (esperanza) (decepción) 

















Reforzamiento 1 2 3 4 
positivo 
(obtención Descenso Ascenso Ascenso Descenso 
de comida) 
(esperanza) 








Reforzamiento 
negativo 
(evitación 
de descarga) 
(miedo) 


5 6 7 
Ascenso Descenso Descenso 


Los recuadros 5 a 8 contienen las predicciones cuando el procedimiento ins- 
trumental incluye un reforzamiento negativo, tal como la evitación de una des- 
carga. La emoción subyacente que motiva la conducta instrumental, en este caso, 
es el miedo. Este miedo se intensifica cuando se presenta un EC que también 
provoca miedo (recuadro 5). Por tanto, hay que predecir un aumento en la tasa de 
respuesta instrumental. El miedo se reduce con la presentación de un EC que se 
asocie con la retirada o ausencia del El aversivo (recuadro 6). Las respuestas 
instrumentales disminuyen, por tanto. Posiblemente, el miedo se reduce también 
cuando el estímulo clásicamente condicionado provoca esperanza (recuadro 7), 
porque el miedo y la esperanza son emociones incompatibles. Por último, espera- 
remos que la respuesta instrumental aumente cuando se presenta un EC— para un 
El apetitivo (recuadro 8) porque tanto la desilusión como el miedo son estados 
emocionales aversivos. 


Resultados que se corresponden con la teoría moderna de los dos proce- 
sos. Ya hemos advertido que la medida concurrente de la conducta instrumental 
y las respuestas clásicamente condicionadas no puede utilizarse para evaluar la 
teoría moderna de los dos procesos. ¿Cómo pueden entonces comprobarse expe- 
rimentalmente las predicciones de la tabla 10.2? Los experimentos que se han 
realizado para evaluar la teoría moderna de los dos procesos fueron diseñados 
después del procedimiento REC, y se llaman experimentos de transferencia de 
control. Estos experimentos constan básicamente de tres fases, como se destaca 
en la tabla 10,3. La fase 1 consiste en el condicionamiento instrumental de una 
respuesta operante, mediante el uso de algún programa de reforzamiento positivo 
o negativo. En la fase 2, a los sujetos se les somete a un condicionamiento clásico 
en el que un EC explícito se asocia con la presencia o la ausencia de un estímulo 
incondicionado. La fase 3 es la fase esencial, la de transferencia. En ella se per- 
mite al anima! que dé la respuesta instrumental, y se le presenta periódicamente 
el EC de la fase 2 para ver qué efecto tiene sobre la tasa de la conducta instrumen- 


Capítulo 10 
LA INTERACCION DEL CONDICIONAMIENTO 


CLÁSICO Y EL INSTRUMENTAL 


El capítulo 10 se dedica a una discusión general sobre las formas en que pue- 
den interactuar el condicionamiento clásico y el instrumental. Comienza con una 
descripción de los experimentos que han evaluado el posible papel que desem- 
peña el reforzamiento instrumental en los procedimientos de condicionamiento 
clásico. Se describen después algunos de los extensos trabajos teóricos y experi- 


mentales que se han realizado para valorar el papel del condicionamiento clásico 
en las situaciones de condicionamiento instrumental. 


EL PAPEL DEL REFORZAMIENTO INSTRUMENT 
AL EN LOS - 
MIENTOS DE CONDICIONAMIENTO CLASICO OD 
7 procedimiento de control por omisión 
modificación del El por la respuesta condicionad, 
EL PAPEL DEL CONDICIONAMIENTO CLASICO E ; 
N LOS PROCE - 
TOS DE CONDICIONAMIENTO INSTRUMENTAL MEN 
El mecanismo rm-em 
Las funciones de rm-em 
Le El canisImo pm y el reforzamiento instrumental positivo 
meúrción concurrente de la conducta instrumental y d Í 
sicamente condicionadas MEMey e de respuestas clá 
Las respuestas preinstrumentales clásicamente condicionadas 
Las respuestas coincidentes clásicamente condicionadas 
Las respuestas postinstrumentales clásicamente condicionadas 


Implicaciones de los experimentos con medición concurrente 
mecanismo rm-em 


La teoría moderna de los dos procesos 
Predicciones específicas de la teoría moderna de los dos procesos 
Resultados que se corresponden con la teoría moderna de los dos procesos 
Interacciones de respuesta en el efecto de los estímulos clásicamente condi- 
cronados sobre la conducta instrumental 


Las propiedades estimulares discriminativas de los estados clásicamente con- 
dicionados ] 

¿Estados emocionales centrales condicionados o e 
recompensa? 


COMENTARIOS FINALES 


para el 


xpectativas especificas de 


El condicionamiento clásico y el instrumental son claramente distimguibles 
desde un punto de vista conceptual y de acuerdo con los procedimientos estándar 
utilizados para investigarlos. Como ya vimos en los capitulos 3 y 4, se supone que 
el condicionamiento clásico implica el aprendizaje de relaciones, o asociaciones, 
entre estímulos (normalmente el EC y el ED, y los procedimientos de condicio- 
namiento clásico se centran en la relación temporal entre los distintos estímulos, 
independientemente de lo que haga el animal. Por el contrario, como ya adverti- 
mos en los capítulos 5-7, se supone que el condicionamiento instrumental implica 
el aprendizaje o redistribución de las respuestas del animal, y los procedimientos 
de aprendizaje instrumental se centran en la relación entre las apariciones de una 
respuesta específica (instrumental) y la administración del reforzador. A pesar de 
estas distinciones conceptuales y de procedimiento entre el condicionamiento clá- 
sico e instrumental, en la práctica la mayoría de los procedimientos de condicio- 
namiento implican componentes tanto instrumentales como clásicos. Es caracte- 
rístico que en los procedimientos de condicionamiento intervengan tanto rela- 
ciones estímulo-estímulo como respuesta-resultado. Además, aislar los efectos de 
esos componentes es a menudo difícil, y a veces imposible. 

Ya vimos ejemplos de la interacción de los procesos de condicionamiento 
clásico e instrumental en los análisis del aprendizaje discriminativo (capitulo 8) y 
de la conducta de evitación y de castigo (capítulo 9). En el presente capítulo 
vamos a considerar la interacción del condicionamiento clásico y el instrumental 
de una forma más general. Describiremos primero el papel potencial de los pro- 
cesos de condicionamiento imstrumental en los experimentos de condiciona- 
miento clásico, y las formas en que los investigadores han tratado de eliminar este 
condicionamiento instrumental. Vamos a describir a continuación el papel poten- 
cial que desempeñan los procesos de condicionamiento clásico en el aprendizaje 
instrumental. : 

Mediante procedimientos especiales se han obtenido pruebas de que el condi- 
cionamiento clásico puede producirse sin mucho reforzamiento instrumental. Sin 
embargo, no existen procedimientos experimentales que permitan la aparición de 
aprendizaje instrumental sin la posibilidad de un condicionamiento clásico. 
Debido a esto, gran parte del esfuerzo teórico y experimental se ha dedicado a 
dilucidar el papel del condicionamiento clásico en las situaciones de aprendizaje 
instrumental. 


EL PAPEL DEL REFORZAMIENTO INSTRUMENTAL 
EN LOS PROCEDIMIENTOS DE CONDICIONAMIENTO CLASICO 


En los procedimientos de condicionamiento clásico se presenta periódica- 
mente un estimulo condicionado seguido de un estímulo incondicionado. Con las 


AAA 
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repeticiones de esos ensayos EC-El, los sujetos llegan a dar una respuesta condi- 
cionada al EC, pero la aparición de la respuesta condicionada no determina que se 
presente el El. El El se presenta independientemente de la respuesta condicio- 
nada. De hecho, este aspecto del condicionamiento clásico es una de las bases 
fundamentales para distinguir los procedimientos de entrenamiento clásico e ins- 
trumental. Sin embargo, durante mucho tiempo los investigadores de los meca- 
nismos de condicionamiento clásico se han interesado por el hecho de que en 
muchos procedimientos de condicionamiento clásico existe una Oportunidad para 
el condicionamiento instrumental, y este reforzamiento puede ser, parcialmente, 
el responsable del aprendizaje que tiene lugar (Coleman y Gormezano, 1979; 
Gormezano y Coleman, 1973). ] 

El potencial de reforzamiento instrumental en el condicionamiento clásico 
resulta más obvio en aquellas situaciones en que el sujeto da respuestas condicio- 
nadas anticipatorias. Las respuestas condicionadas anticipatorias aparecen antes 
de la presentación del estímulo incondicionado en un ensayo determinado, Este 
emparejamiento de la RC con el El proporciona al menos dos oportunidades 
posibles para el reforzamiento instrumental. En primer lugar, si el El es un 
reforzador positivo, tal como comida, su presentación poco después de la RC 
puede dar lugar a un reforzamiento involuntario de la RC. En segundo lugar, la 
aparición de la RC puede alterar de alguna manera el estímulo incondicionado de 
forma que lo convierta en más eficaz o más reforzante dentro del condiciona- 
miento (por ejemplo, Hebb, 1956; Perkins, 1955, 1968). La posibilidad de que las 
respuestas condicionadas puedan hacer más eficaz o más reforzante el El fue 
reconocida primero por Schlosberg (1937). Este propuso, por ejemplo, que los 
perros pueden aprender a salivar en un experimento de condicionamiento en el 
que se utilice la comida como El debido a que la salivación anticipatoria hace que 


la comida seca se disuelva y se trague mas fácilmente. De forma similar, puede : 


aprenderse la salivación en una situación de condicionamiento clásico con una 
gota de ácido como El debido a que la salivación anticipatoria ayuda a diluir el 
sabor aversivo del ácido. Se puede afirmar que esas modificaciones instrumentales 
del El se producen en todos los experimentos de condicionamiento clásico. 

Se han ideado dos estrategias experimentales para evaluar el papel del refor- 
zamiento instrumental en las situaciones de condicionamiento clásico. Una de 
ellas elimina eficazmente la posibilidad de que la respuesta condicionada sea 
reforzada con la presentación del El. La otra técnica se ha diseñado para valorar 
el papel de las modificaciones en el estímulo incondicionado originadas por la 
aparición de la RC, y para hacerlo provoca especificamente esos cambios en el El. 
Los experimentos que han utilizado las dos estrategias indican que el reforza- 
miento instrumental no es necesario para el aprendizaje que tiene lugar en los 
procedimientos de condicionamiento clásico. Consecuentemente, puede obser- 
varse condicionamiento clásico aun cuando la situación no permita la aparición 
del reforzamiento instrumental. 


El procedimiento de control por omisión 


Como ya advertimos antes, si el El es un reforzador positivo, tal como la 
comida, la presentación del El después de la RC puede dar lugar a un reforza- 
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miento involuntario de la RC. Los investigadores han intentado excluir este típo 
de reforzamiento instrumental modificando el procedimiento de condicionamien- 
to clásico estándar. La técnica modificada, llamada procedimiento de control por 
omisión, viene representada en el esquema de la figura 10.1. En el procedimiento 
de control por omisión, la presentación del El en un ensayo determinado depende 
de que se haya dado la respuesta condicionada que interesa. S1, en un ensayo 
concreto, el sujero no da la respuesta condicionada, el EC va seguido del El como 
ocurre normalmente, Por el contrario, si el sujeto realiza la respuesta condicio- 
nada, el El se omite en ese ensayo. La contingencia de la omisión asegura que la 
RC específica no va a ir seguida por el El. Se supone que este procedimiento 
imposibilita el reforzamiento instrumental de la respuesta condicionada, 

El procedimiento de control por omisión fue introducido por Sheffield (1965) 
en un estudio de condicionamiento salivar con perros. Realizó pruebas de condi- 
cionamiento con perros utilizando comida y ácido en la boca como estímulos 
incondicionados. En los dos tipos de condicionamiento, la omisión del El cuando 
se presentaba la RC no impedía el desarrollo de la salivación condicionada. La 
adquisición de la salivación condicionada fue, generalmente, más lenta con el pro- 
cedimiento de control por omisión que con las presentaciones del El en todos los 
ensayos. Sin embargo, el procedimiento de omisión fue notablemente eficaz. Un 
perro, por ejemplo, siguió salivando en un 50 por 100 de ensayos después de 800 
ensayos con el procedimiento de control por omisión. 

Desde que Sheffield introdujo el procedimiento de control por omisión, se ha 
comprobado en una gran variedad de situaciones de condicionamiento clásico (por 
ejemplo, Gormezano y Hiller, 1972; Patten y Rudy, 1967). Se ha utilizado, quizá, 
con más frecuencia, en estudios de seguimiento del signo (véase Locurto, 1981, 
para una revisión). Como ya advertimos, en el seguimiento del signo los anima- 
les se acercan y tocan (picotean, en el caso de las palomas) los estímulos que 
señalan la entrega de un reforzador positivo, tal como la comida. Las investiga- 
ciones del control por omisión en el seguimiento del signo han proporcionado 
resultados contradictorios (por ejemplo, Hursh, Navarick y Fantino, 1974; 
Williams y Williams, 1969). 

Peden, Browne y Hearst (1977) ofrecieron una notable demostración de 
seguimiento del signo en un procedimiento de control por omisión. Se realizaron 
pruebas con palomas en una cámara experimental en la que se había construido 
una tolva para comida en la pared, y había una tecla de respuesta en una pared 
adyacente, a 35 centímetros de distancia. Una tecla de luz se iluminaba periódi- 
camente durante 8 segundos, y después se tenia acceso al grano durante 5 segun- 


Ensayo sin RC Ensayo con RC 
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Figura 10.1.—Diagrama del procedimiento de control por omisión. En los ensayos sin respuesta con-' 


dicionada, el El sigue al EC de la forma habitual (cuadro de la izquierda). En los ensayos con respuesta 
condicionada, se omite el El (cuadro de la derecha). 
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Figura 10,2, —Porcentaje de ensayos (tomando bloques de cinco sesiones) en los que se observó la 

respuesta condicionada (acercamiento al EC). Cada sesión constaba de 50 ensayos. Durante los prime- 

ros ocho bloques de sesiones (2.000 ensayos) estuvo en marcha un procedimiento de control de omi- 

sión. Durante el resto del experimento se llevó a cabo un procedimiento de condicionamiento clásico 
estándar. (Según Peden, Browne y Hearst, 1977.) 


dos. La aproximación a la tecla de la luz se consideró como respuesta condicio- 
nada. En la primera fase del experimento (control por omisión), se cancelaba la 
administración de comida al final del ensayo si la paloma se acercaba a menos de 
20-25 centímetros del EC (la clave luminosa). En la fase 2, la comida seguía 
siempre a la iluminación de la tecla de luz, independientemente de lo que hicieran 
las palomas. Los investigadores midieron el porcentaje de ensayos en los que los 
animales se aproximaban al EC luminoso durante cada fase del experimento, 
En la figura 10.2 se muestran los resultados. Un hallazgo llamativo fue que las 
palomas seguían aproximándose al EC luminoso durante la primera fase del 
experimento, aun cuando tales conductas de aproximación impidieran la entrega 
de comida. Cada día se llevaron a cabo 50 ensayos, y después de 2.000 ensayos 
todavía se observó que las palomas se acercaban al EC un 40 por 100 de las veces. 
Esto sucedía aun cuando los sujetos no estaban al lado de la tecla de respuestas al 
comienzo del ensayo. Otras investigaciones han mostrado que se producían 
muchas menos respuestas de aproximación al EC si el EC y la comida se presen- 
taban al azar, de forma que el EC no señalaba la comida (Peden y otros, 1977 
Experimento 2). Así pues, cono sucedía en el experimento de Sheffield ( 1965), 
no era necesaria uma contingencia instrumental para que surgiera la respuesta 
condicionada. 
En el experimento de Sheffield con perros, la adquisición de la salivación 
condicionada fue más lenta con el procedimiento de control por omisión que con 
un procedimiento de condicionamiento clásico estándar. Peden y otros obtuvieron 
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resultados similares en el seguimiento del signo. En la segunda fase de su expe- 
rimento, cuando todos los ensayos terminaban con la entrega de comida, las res- 
Puestas de aproximación aumentaban (véase figura 10.2). En los estudios de este 
tipo, frecuentemente se ha hallado un mayor nivel de rendimiento con el condi- 
cionamiento clásico que con el procedimiento de control por omisión (por ejem- 
plo, Schwartz y Williams, 1972). 

La diferencia entre el control por omisión y los procedimientos de condicio- 
namiento clásico estándar ha sido tema de considerable debate (Jenkins, 1977; 
Locurto, 1981) ¿Por qué los procedimientos de control por omisión llevan a nive- 
les más bajos de respuestas que el condicionamiento clásico? Una alternativa hace 
bincapié en el condicionamiento clásico y explica el nivel inferior de respuestas 
señalando que hay un menor número de EL, ya que en el procedimiento de control 
por omisión las RC que se dan impiden la administración del El. El condiciona- 
miento clásico lleva, generalmente, a niveles más bajos de rendimiento si sola- 
mente algunas presentaciones del EC terminan con la administración del El 
Otras alternativas ponen el énfasis en el condicionamiento instrumental. Los pro- 
cedimientos de control por omisión pueden producit niveles más bajos de res- 
puesta porque castigan la respuesta condicionada reteniendo una recompensa 
esperada. También puede que la probabilidad de la respuesta condicionada baje 
porque se suministra reforzamiento a las actividades incompatibles con la RC 
escogida (ya que sólo las respuestas que no son la RC pueden ir seguidas de una 
recompensa en el entrenamiento por omisión). Otra posibilidad es que el refor- 
zamiento instrumental involuntario de la RC durante el condicionamiento clásico 
estándar eleve el nivel de respuestas en el condicionamiento clásico estándar por 
encima de lo que se observa en el entrenamiento por omisión. El experimento de 
control por omisión mo mos capacita para decidir entre esas alternarivas. 

Una segunda parte del debate sobre los resultados de los procedimientos de 
control por omisión en el seguimiento del signo se ha centrado en la razón por la 
que persisten las respuestas en muchos casos, aunque no en todos. Muchos auto- 
res (por ejemplo, Williams y Williams, 1969) han considerado la persistencia de 
las respuestas como prueba de que la conducta se aprendió y se mantuvo a través 
de procesos de condicionamiento clásico. Los que disienten de esta concepción 
consideran el seguimiento del signo como un resultado absoluto del condiciona- 
miento instrumental, y atribuyen las respuestas condicionadas que aparecen en el 
entrenamiento por omisión a la generalización de otras respuestas que, supues- 
tamente, se refuerzan de forma inadvertida mediante la administración del El que 
se produce en el procedimiento de control por omisión (Dougan, McSweeney, 
O'Reilly y Eacker, 1983). Esta explicación de la generalización de la respuesta se 
corresponde con los resultados de algunos estudios sobre picoteo de una tecla en 
las palomas (por ejemplo, Barrera, 1974; Jenkins, 1981). Sin embargo, la hipóte- 
sis puede no ser aplicable a los resultados del entrenamiento por omisión de otras 
respuestas y de otras especies. Además, la hipótesis no puede explicar por qué 
ciertas respuestas se adquieren de forma consistente en el seguimiento del signo 
aun cuando no se necesitan para obtener el reforzamiento. Dadas estas dificulta- 
des, no podemos rechazar el condicionamiento clásico como factor importante en 
el seguimiento del signo. 
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La modificación del El por la respuesta condicionada 


Una segunda técnica experimental que se ha utilizado para evaluar la contri- 
bución del reforzamiento instrumental al aprendizaje que tiene lugar en los pro- 
cedimientos de condicionamiento clásico se ha centrado en las posibles modifica- 
ciones del El originadas por la respuesta condicionada. Considérese, por ejemplo, 
una situación de condicionamiento clásico en la que el El es un estímulo aversivo. 
Quizá en tales casos el sujeto aprende a dar la RC porque la RC reduce de alguna 
manera la aversión al El (Quizá al dar la RC el sujeto se prepara para «resis- 
tirse» contra el El.) Si esto es así, hacer que la intensidad del El se reduzca 
mediante la ejecución de la RC debería facilitar la adquisición de la respuesta 
condicionada. 

La importancia de las modificaciones del El por la RC fue investigada en un 
experimento sobre condicionamiento de respuesta de la membrana niccitante de 
los conejos (Coleman, 1975). El EC fue un tono, y el El una descarga breve en la 
piel cercana a un ojo. La retracción de la membrana niccitante que hay sobre el 
ojo se midió como respuesta condicionada (e incondicionada). Se, realizaron prue- 
bas con cuatro grupos de conejos. Todos los grupos recibieron una descarga de 5 
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miliamperios después del EC en los ensayos en los que no se daba una respuesta 
condicionada. Los conejos del grupo 5-5 también recibían una descarga de 5 mA 
en los ensayos en que realizaban una respuesta condicionada. Para el resto de los 
grupos, la intensidad de la descarga disminuía cuando ejecutaban la respuesta 
condicionada. En el grupo 5-3, la descarga disminuyó a 3,3 mA en los ensayos en 
los que se daba la RC. En el grupo 5-1, la RC disminuía la intensidad de la 
descarga a 1,7 mA, y en el grupo 5-0, la RC impedía la administración de la 
descarga (esencialmente, el grupo 5-0 recibía un procedimiento de control por 
omisión). Si la reducción de la descarga proporciona un reforzamiento instrumen- 
tal importante a la respuesta condicionada en este tipo de condicionamiento clá- 
sico, debería de producirse un mejor aprendizaje en los grupos 5-3, 5-1 y 5-0 que 
en el grupo 5-5. 

En la figura 10.3 se muestran los resultados. En contra de la predicción del 
reforzamiento instrumental, el nivel y velocidad del condicionamiento no aumen- 
taban al reducir la intensidad de la descarga cuando se ejecutaba la respuesta 
condicionada. Los grupos 5-3, 5-1 y 5-0 no aprendían la respuesta de la mem- 
brana niccitante más rápido que el grupo 5-5. De hecho, la única diferencia evi- 
dente entre los grupos era que la reducción completa de la intensidad de la des- 
carga a O mÁ cuando se presentaba la respuesta condicionada (grupo 5-0), daba 
como resultado un nivel inferior de condicionamiento que en los otros grupos. 
Este resultado refleja, probablemente, el hecho de que el grupo 5-0 no recibía la 
descarga en todos los ensayos mientras que el otro grupo sí. 

Estos resultados ofrecen pruebas fehacientes de que las modificaciones del El 
causadas por la RC no eran necesarias para el condicionamiento clásico de la 
respuesta de la membrana niccitante, y ni siquiera facilitaban el aprendizaje. Así 
pues, el condicionamiento clásico puede producirse en ausencia de un reforza- 
miento instrumental, Sin embargo, esto no significa que el reforzamiento instru- 
mental no desempeñe papel alguno en ningún procedimiento de condiciona- 
miento clásico. La contribución del reforzamiento instrumental tiene que eva- 
luarse separadamente en cada caso con la técnica que hemos descrito. 


EL PAPEL DEL CONDICIONAMIENTO CLASICO 
EN LOS PROCEDIMIENTOS DE CONDICIONAMIENTO INSTRUMENTAL 


Como ya advertimos en los capítulos 5 y 8, en un procedimiento de condicio- 
namiento instrumental la respuesta instrumental se ejecuta en presencia de cier- 
tos estímulos diferenciados, y va seguida del reforzador. Esta secuencia de hechos 
se revisa en la figura 10.4. EA representa los estímulos que están presentes 
cuando se da la respuesta instrumental, R representa la respuesta instrumental, y 
ER+ representa el estímulo reforzante. La línea ondulada entre la respuesta y el 
estímulo reforzante significa que la respuesta provoca la administración del refor- 
zador. Esta relación causal asegura que el reforzador se va a emparejar con la 
exposición del sujeto a los estímulos EA. El emparejamiento de los estímulos EA 
con el reforzador puede dar lugar a un condicionamiento clásico, y se puede desa- 
rrollar una asociación entre los estímulos EA y el reforzador. 

En la sección anterior discutimos las formas en que el reforzamiento instru- 
mental puede excluirse como factor eu los procedimientos de condicionamiento 
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EA ER + Figura 10.4.—Relaciones que 
existen en el condicionamiento 
instrumental. La respuesta ins- 
trumental (R) aparece en pre- 
sencia de estímulos distintivos 
(EA) y provoca la liberación del 
reforzador (ER +). El reforza- 

R miento de la respuesta R en pre- 
sencia de los estímulos EA per- 
mite el condicionamiento clásico de EA por el reforzador. 


clásico. Desgraciadamente, no existen estrategias análogas para eliminar el condi- 
cionamiento clásico en los procedimientos instrumentales. Para evitar el condi- 
cionamiento clásico uno no puede omitir la presentación del reforzador después 
de la exposición del animal a los estímulos EA, porque esto también daría lugar al 
no reforzamiento de la respuesta instrumental. 

La especificación de una respuesta instrumental asegura que el animal expe- 
rimentará siempre ciertos estímulos diferenciados (EA) en relación con la ejecu- 
ción de la respuesta. Estos estímulos pueden incluir el lugar donde se va a realizar 
la respuesta, la textura del objeto que el sujeto va a manipular, o las distintas 
claves visuales u olfativas. Cualesquiera que puedan ser, el reforzamiento de la 
respuesta instrumental dará inevitablemente, como resultado, el emparejamiento 
entre los estímulos EA y el reforzador. La única manera de impedir este empare- 
jamiento es no presentar el reforzador. Sin embargo, esto impediría también el 
condicionamiento instrumental. No debemos suponer que el emparejamiento de 
los estímulos EA con el reforzador va a producir inevitablemente un condiciona- 
miento clásico. Como ya advertimos en los capítulos 3 y 4, el que se produzca el 
condicionamiento clásico depende de mucho más que del simple emparejamiento 
de estímulos. No obstante, el emparejamiento de los estímulos EA con el reforza- 
dor proporciona el potencial para que se produzca el condicionamiento clásico. 
Consecuentemente, muchas teorías importantes se han interesado por el papel 
del condicionamiento clásico en el control de la conducta instrumental. 


El mecanismo rm-em 


Una de las explicaciones primeras y más influyentes del papel del condicio- 
namiento clásico en la conducta instrumental fue propuesta, originariamente, por 
Clark Hull (1930, 1931) y, posteriormente, elaborada por Kenneth Spence 
(1956). Esencialmente, Hull y Spence añadieron un componente de condiciona- 
miento clásico al mecanismo de la conducta instrumental propuesto por Thorn- 
dike. Podemos recordar del capítulo 5 que, según Thorndike, el reforzamiento de 
una respuesta instrumental aumenta la probabilidad futura de la conducta al esta- 
blecer una asociación entre la respuesta y los estímulos presentes en el momento 
que se da la respuesta. Utilizando los símbolos de la figura 10.4, la concepción de 
Thorndike consiste en suponer que el reforzamiento establece uma asociación 
entre los EA y la R. Por tanto, en el futuro, la presencia de los estímulos EA 
desencadenará directamente la aparición de la respuesta instrumental. Esta esti- 
mulación directa de la respuesta instrumental es el proceso de condicionamiento 
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instrumental. Hull y Spence sugirieron que existe también un proceso de condi- 
cionamiento clásico que fomenta o motiva la conducta instrumental, Especifi- 
cando más: suponían que, en el transcurso del condicionamiento instrumental, los 
animales no sólo aprenden a dar la respuesta instrumental R en presencia de los 
estímulos EA, sino que adquieren también la expectativa de que van a tener una 
recompensa. Esta expectativa de recompensa se aprende a través del condiciona- 
miento clásico, y motiva también la respuesta instrumental. 

Parece intuitivamente razonable que la conducta instrumental ocurra en parte 
porque los organismos aprenden a esperar recompensa. 5í tuviéramos que hacer 
introspección sobre por qué ejecutamos ciertas respuestas instrumentales, la con- 
clusión sería probablemente: porque esperamos ser reforzados. Vamos a trabajar 
porque esperamos que se nos pague; preparamos un examen porque esperamos 
que eso nos ayude a obtener un título superior. Para incorporar esas ideas a una 
explicación sistemática de la conducta instrumental, tenemos que especificar con 
más detalle qué expectativas existen, cómo se aprenden, cuándo ocurren en rela- 
ción con la respuesta instrumental, y cómo motivan la conducta instrumental. El 
mecanismo rm-em ofrece respuestas a estas cuestiones. 

Hull y Spence reconocieron que siempre que la respuesta instrumental va 
seguida del reforzador ER+ , los estímulos EA que están presentes en el momento 
de la respuesta se emparejan con el reforzador. Se supone que este empareja- 
miento da lugar al condicionamiento clásico de los estímulos EA por el reforzador 
ER+. Hull y Spence creyeron que el condicionamiento clásico se produce por 
sustitución del estimulo. Como ya señalamos en el capítulo 4, la hipótesis de la 
sustitución del estímulo sostiene que el estímulo condicionado adquiere, de alguna 
manera, proptedades del estímulo incondicionado. En el paradigma del condicio- 
namiento instrumental, EA desempeña el papel del EC y el reforzador desem- 
peña el papel del El. Por tanto, Hull y Spence supusieron que EA llegaría a 
provocar algunas de las mismas respuestas que provoca el reforzador. Si en el 
entrenamiento instrumental el reforzamiento usado es la comida, el animal le- 
gará probablemente a salivar y quizá a realizar movimientos de masticación 
cuando experimente los estímulos EA. Estas respuestas clásicamente condiciona- 
das rara vez son tan intensas como la salivación y la masticación provocadas por 
la comida misma, y se producen como anticipación a la administración de comida. 
Por tanto, se llaman respuestas fraccionales anticipatorias de la meta. El sím- 
bolo convencional para tal respuesta es rm. 

Las respuestas anticipatorias de la merca son también evidentes en algunos 
tipos de conducta humana. Tocar el billete del autobús antes de subir en él, rela- 
merse los labios como anticipación a una buena comida, y «adelantarnos a nos- 
otros mismos» al hablar son ejemplos de respuestas anticipatorias. 

La respuesta fraccional anticipatoria de la meta es similar a otros tipos de 
respuestas. Como ya advertimos en el capitulo 2, las respuestas producen habi- 
tualmente algún tipo de retroalimentación sensorial. Es decir, el acto de dar una 
respuesta crea, normalmente, sensaciones corporales características. La retroali- 
mentación sensorial producida por la respuesta fraccional anticipatorta de la meta 
se presenta mediante el símbolo em. 

La respuesta fraccional anticipatoria de la meta, con su estímulo em de retroa- 
limentación, constituye presumiblemente la expectativa de recompensa. La figura 
10.5 ilustra la secuencia completa de acontecimientos en el mecanismo rm- enn. El. 
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Figura 10.5.—El mecanismo rm- 
em. Durante el condicionamien- 
: to instrumental, la respuesta Ins- 
trumental R es seguida por el 
reforzador. Al ocurrir esto en 
presencia de las claves simuacio- - 


Arann 


A nales distintivas EA, se forma 


una asociación entre EA y R (He- 
cha a). La liberación del reforza- 
dor que sigue a la exposición a EA provoca el condicionamiento clásico de EA por el reforzador. Por 


tanto, ÉA provoca una respuesta rm, fraccional y clásicamente condicionada, anticipatoria de la meta, 


con sus claves de retroalimentación em. Como la respuesta instrumental R es ceforzada en presencia 
de em, también se establece una asociación entre em y R (flecha 5). 


EA elicita la respuesta fraccional anticipatoria de meta rm antes de que se pre- 
sente la respuesta instrumental. Así pues, la respuesta instrumental se da en 
presencia de la retroalimentación sensorial em proveniente de rm. Dado que la 
respuesta instrumental es reforzada cuando se ejecuta después de experimentar el 
em, se establece una conexión entre entre em y la respuesta R. El resultado de 
estos hechos es que, a medida que el condicionamiento instrumental avanza, la 
respuesta inscrumental llega a estar estimulada por dos factores, En primer lugar, 
la presencia del EA provoca directamente la respuesta instrumental por asocia- 
ción con R. En segundo lugar, la actividad instrumental también llega a realizarse 
como respuesta a la expectativa de recompensa (rm- em) debido a la asociación 
entre em y R (véase figura 10.5). 


Las funciones de rm-em. Se supone que el mecanismo de la respuesta frac- 
cional anticipatoria de la meta (rm-em) posee dos funciones importantes. La 
primera, contribuir al nivel general de motivación del animal y, por tanto, realzar 
la conducta instrumental, La segunda, dirigir la conducta. Debido a la asociación 
de la respuesta instrumental (R) con el estímulo de retroalimentación (em) pro- 
veniente de la respuesta fraccional anticipatoria de la meta (véase flecha b en la 
figura 10.5), podemos predecir que la respuesta instrumental va a aparecer siem- 
pre que se observe la respuesta fraccional anticipatoria de la meta. Una vez que la 
respuesta instrumental se ha condicionado al em, se producirá en presencia de 
cualquier estímulo que provoque la respuesta fraccional anticipatoria de la meta. 
Como veremos, se han abandonado las propiedades motivacionales generales del 
rm-em en las formulaciones teóricas contemporáneas. Sin embargo, la segunda 
función de rm-em, Ta de dirigir la conducta, continúa reconociéndose. 


. El mecanismo rm-em y el reforzamiento instrumental positivo. El meca- 
nismo rm-em concuerda con numerosos aspectos de la conducta instrumental 
reforzada positivamente. Predice, por ejemplo, que los procedimientos de condi- 
cionamiento clásico influyen en la realización de la conducta instrumental refor- 
zada positivamente. Considérese, por ejemplo, un procedimiento de discrimina- 
ción en el que las ratas son reforzadas por presionar una palanca de respuesta en 
presencia de un tono (E+) y no son reforzadas en asuencia del tono. ¿De qué 
forma podría esta presión discriminada de la palanca estar influida por los proce- 


PRINCIPIOS DE APRENDIZAJE Y DE CONDUCTA 381 


dimientos de condicionamiento clásico en los que interviene un tono? El meca- 
nismo rm-em predice que la ejecución de la respuesta de presión de la palanca en 
presencia del tono sería facilitada si, previamente, se llevara a cabo un programa 
de condicionamiento clásico en el que, de forma repetida, el tono se emparejara 
con la comida. Se puede quitar la palanca de respuesta de la cámara experimental 
durante esta fase para evitar que las presiones de la palanca se refuercen de forma 
accidental. El condicionamiento clásico del E+ con la comida debería condicionar 
la respuesta fraccional anticipatoria de la meta al tono E+. La elicitación de rm 
por el tono debería aumentar la motivación para la conducta instrumental, y de 
este modo, incrementar las presiones de la palanca durante la presentación del 
tono. Por el contrario, una vez que se ha establecido la respuesta discriminada de 
presión de la palanca, la extinción de la respuesta fraccional anticipatoria de la 
meta debería producir un descenso en la conducta instrumental. Tal extinción 
puede lograrse quitando la palanca de respuesta de la cámara experimental y 
presentando de forma repetida el E+ sin la comida. Es de esperar que la extinción 
de la respuesta fraccional anticipatoria de la meta reduzca tanto sus funciones 
motivacionales como de dirección de la respuesta. Se han obtenido pruebas que 
corroboran estas y otras predicciones similares acerca de los mecanismos rm-em 
(por ejemplo, Trapold y Winokur, 1967). 


La medición concurrente de la conducta instrumental y de las respuestas 
clásicamente condicionadas 


Los experimentos examinados arriba implicaban, de alguna forma, prediccio- 
nes indirectas a partir del mecanismo rm-em. Una implicación directa es que 
durante el condicionamiento instrumental se desarrollan respuestas clásicamente 
condicionadas. Por otra parte, el mecanismo rm-em especifica cómo deberían 
relacionarse estas respuestas clásicamente condicionadas con la aparición de la 
respuesta instrumental. El mecanismo rm-em trata las respuestas clásicamente 
condicionadas como un reflejo de las expectativas de recompensa que motivan la 
respuesta instrumental. Por tanto, predice que en cualquier ensayo las respuestas 
clásicamente condicionadas comienzan antes de la conducta instrumental (véase 
figura 10.5). | 

Quizá el enfoque más simple y directo para investigar el papel del condicio- 
namiento clásico en el aprendizaje instrumental consista en medir al mismo 
tiempo las respuestas condicionadas clásica e instrumentalmente. Este es el enfo- 
que adoptado en los experimentos de medición concurrente. Se han llevado a 
cabo numerosas investigaciones de este tipo en situaciones de reforzamiento posi- 
tivo y negativo (para una revisión véase Black, 1971; Rescorla y Solomon, 1967). 
Todos estos experimentos suministran pruebas de que durante el condiciona- 
miento instrumental se aprenden respuestas clásicamente condicionadas. Sin 
embargo, la relación entre los dos tipos de respuestas condicionadas varía de una 
situación a otra. En vez de resumir todas las pruebas, vamos a describir los resul- 
tados de unos pocos experimentos importantes con reforzamiento positivo para 
ilustrar los distintos resultados que pueden obtenerse. 


Las respuestas preinstrumentales clásicamente condicionadas. En algunas 
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Fsgura 10.6.—Velocidad de lameteo de un tubo de agua, tomando intervalos de 1/2 segundo, antes y 
después de la respuesta de apretar una palanca. (Según Miller y DeBold, 1965.) 


situaciones experimentales, la relación entre las respuestas clásica e imstrumen- 
talmente condicionadas es tal como predecía el mecanismo rm-em. Es decir, las | 
respuestas clásicamente condicionadas empiezan antes de la actividad imstrumen- 
tal. En una demostración de esta clase, Miller y DeBold (1965) condicionaron 
unas ratas a presionar una palanca para obtener reforzamiento de agua. Se intro- 
ducía un chorro de agua en la boca de cada animal a través de un tubo de metal 
permanentemente atado a su cabeza. Además de registrar las apariciones de la 
respuesta de presión de la palanca, Miller y DeBold midieron la frecuencia con 
que las raras lamían el tubo que administraba el agua. Se suponía que el lamido se 
había condicionado clásicamente, debido al reforzamiento con agua. Las respues- 
tas de presión de la palanca iban casi siempre acompañadas de conducta de lamer. 
Se observó que las ratas también lamían el tubo en otros momentos. Sin embargo, 
el lamido era mucho menos vigoroso cuando no acompañaba a la presión de la 
palanca. En la figura 10.6 se ilustra la relación entre los lamidos y la presión de la 
palanca, que muestra la tasa de lamidos por períodos de 1/2 segundo antes y 
después de las respuestas de presión de la palanca. Como se puede observar, la 
tasa de lamidos aumentaba gradualmente justo antes de la respuesta de presión de 
la palanca. La tasa más alta de lamidos ocurría justo después de la respuesta, 
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momento en el que, normalmente, se administraba el reforzador, y después de 
esto los lamidos decrecían. Shapiro (1962) observó similares resultados utilizando 
perros reforzados por presionar una palanca con un programa de reforzamiento 
diferencia] de tasa baja (RDB). La salivación, normalmente, comenzaba justo 
antes de que los perros presionaran la palanca de respuesta y continuaba durante 
un rato después de la respuesta, 


Las respuestas comecidentes clásicamente condicionadas. En contra de las 
conclusiones de Miller y DeBold (1965) y de Shapiro (1962), en algunos casos las 
respuestas clásicamente condicionadas cotmciden con las apariciones de la con- 
ducta instrumental durante el condicionamiento instrumental. Un buen ejemplo 
nos lo proporciona la conducta de dos perros con los que Williams (1965) realizó 
ciertas pruebas. Se pedía a los animales que presionaran una palanca de respuesta 
en un programa de intervalo fijo de 16 segundos para obtener un reforzamiento 
de comida. Como ya advertimos en el capítulo 6, un programa de intervalo fijo 
produce habitualmente un patrón de respuestas en «festón». La respuesta imstru- 
mental se produce con una tasa muy baja, si es que llega a aparecer, al comienzo 
del intervalo fijo. Conforme se acerca el final del intervalo (y con él la disponibi- 
lidad del reforzador), la tasa de la respuesta instrumental aumenta gradualmente. 
Además de registrar las respuestas de presión de la palanca de los perros, 
Williams midió su tasa de salivación durante el intervalo fijo. Se interesó por 
saber si el patrón de salivación durante cada ensayo se correspondería con el 
patrón de presión de la palanca. 

Los resultados con cada perro se muestran en la figura 10.7. Los datos repre- 
sentan el rendimiento del animal después de un adiestramiento prolongado. Cada 
gráfico muestra la media de respuestas de presión de la palanca y las gotas de 
saliva que producía cada perro durante los sucesivos períodos de 1 segundo del 
ciclo de intervalo fijo de 16 segundos. Como se puede observar, al comienzo de los 
ciclos de intervalo fijo, los perros rara vez presionaban la palanca y salivaban muy 
poco. Sin embargo, cuando el período de IF se acerca al fin, tanto la presión de la 
palanca como la salivación aumentan gradualmente. Además, el patrón general de 
incremento de estas respuestas hacia el final del intervalo era cast indistinguible 
para las respuestas clásicamente condicionadas (la salivación) y las instrumental- 
mente condicionadas (la presión de la palanca). Otros investigadores (Shapiro, 
1960, 1961) han observado también esta coincidencia de la salivación y la res- 
puesta instrumental en un programa de intervalo fijo. Por otra parte, Kintsch y 
Witte (1962) advirtieron que el patrón temporal festoneado de presión de la 
palanca se aprende más rápido que el patrón festoneado de salivación. 


Las respuestas postimstrumentales clásicamente condicionadas. Hasta ahora 
hemos visto casos en los que las respuestas clásicamente condicionadas preceden 


y/o coinciden con la conducta instrumental. En otras situaciones, las respuestas 


clasicamente condicionadas tienen lugar después de la respuesta instrumental. 
Esto ocurre, por ejemplo, si se refuerza la conducta instrumental con un pro- 
grama de razón fija. Podemos recordar del capítulo 2 que, en un programa de 
razón fija, el único factor que determina la administración de una recompensa es 
la cantidad de respuestas que el sujeto ha dado. No importa el momento en que 
ocurran estas respuestas. Williams (1965) reforzó a unos perros con comida 
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Figura 10.7.—Velocidad de presión de una palanca y de salivación de dos perros durante sucesivos 
incervalos de 1 segundo, en un ensayo de intervalo fijo de 16 segundos, (Según Williams, 1965.) 


cuando presionaban una palanca en un programa de razón fija de 33, y midió 
también la salivación durante este condicionamiento instrumental. La figura 10.8 
muestra lo que encontró con dos de estos sujetos. En cada gráfico se representan 
las tasas de presión de la palanca y de salivación que tenían lugar durante los . 
sucesivos segundos a partir de la recompensa anterior. Con el perro 4 se mues- 
tran los primeros 13 segundos después del reforzamiento; con el perro 7, los 
primeros 23 segundos. Cada perro tardaba algunos segundos en presionar la 
palanca y conseguía una tasa estable de respuestas (entre 1,5 y 2 respuestas por 
segundo) alrededor del cuarto segundo. Sin embargo, la salivación no se producía 
hasta mucho más tarde, cuando el animal esraba a punto de completar el requisito 
de su programa de razón. El perro 4 no mostró una salivación sustancial hasta el 
décimo segundo después de la recompensa anterior, y el perro 7 no aumentó de 
forma considerable su salivación hasta que no habían transcurrido más de 18 
segundos. Ellison y Konorski (1964) han observado una disociación semejante 
entre la conducta instrumental y la salivación condicionada. 


_ Implicaciones de los experimentos con medición concurrente para el meca- 
nismo rm-em. Como hemos observado, la medición concurrente de la conducta 
instrumental y de las respuestas clásicamente condicionadas no ha sido capaz de 
revelar un modelo coherente de resultados. En diferentes situaciones, las respues- 
ras clásicamente condicionadas pueden preceder, coincidir con, o seguir, a la con- 
ducta instrumental. Este patrón variado de resultados no se limita a la salivación 


clásicamente condicionada o a los procedimientos de reforzamiento positivo 


(véase Black, 1971; Rescorla y Solomon, 1967). ¿Dónde deja esto al mecanismo 
rim-em? Como ya advertimos antes, el mecanismo rm-em predice que las respues- 
tas clásicamente condicionadas preceden a la respuesta instrumental. Sin embar- 
go, a veces se observa lo contrario. 
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Figura 10.8.— Velocidad de presión de una palanca y de salivación de dos perros durante sucesivos 
intervalos de 1 segundo, en un ensayo de razón fija. Apretar la palanca se reforzaba con un programa 
de razón fija 33. (Según Williams, 1965.) 


Existen varias reacciones posibles a este tipo de evidencia. Una consiste en 
mantener que el mecanismo rm-em da una explicación útil de la relación entre el 
condicionamiento clásico y el instrumental, pero afirmando que rm no representa 
una respuesta clásicamente condicionada medible (Logan, 1959; MacCorquodale y 
Meehl, 1948). De acuerdo con este enfoque, se considera que rm representa un 
constructo hipotético, una entidad teórica, cuyas características están regidas por 
las reglas del condicionamiento clásico. Se supone que rm no puede observarse 
directamente, pero puede inferirse de ciertos aspectos de la conducta instrumen- 
tal. Si se adopta este enfoque, no se pueden utilizar las pruebas obtenidas en los 
experimentos de medición concurrente para refutar el mecanismo rm-em. 

Un segundo enfoque posible es mantener que rm és una respuesta medible, 
pero sugiriendo que es una de las diversas respuestas clásicamente condicionadas 
que pueden aprenderse durante el entrenamiento instrumental. Quizá los expe- 
rimentos que citamos no medían la respuesta apropiada como índice de rm. Sin 
embargo, si esta alternativa se acepta, tiene que ir acompañada de criterios inde- 
pendientes para decidir de antemano qué respuesta es una buena medida de rm 
en una situación concreta. 

Un tercer enfoque de las diferentes relaciones observadas entre las respuestas 
clásicamente condicionadas y la conducta instrumental es abandonar el meca- 
nismo rm-em y considerar formas alternativas para conceptualizar la relación 
entre el condicionamiento clásico y el instrumental. Este es el enfoque adoptado 
por la moderna teoría de los dos procesos, a la que volveremos más tarde. La 
moderna teoría de los dos procesos ha estimulado mucho la investigación sobre la 
interacción del condicionamiento clásico y el instrumental. Como veremos, sin 
embargo, esta teoría no ha logrado un éxito completo, y se ha hecho necesario 
conservar las funciones de dirección de la respuesta del mecanismo rm-em para 
poder explicar los datos disponibles. 





386 MICHAEL DOMJAN Y BARBARA BURKHARD 
La teoría moderna de los dos procesos 


El modelo de interrelación del condicionamiento clásico y el operante que 
vamos a discutir en esta sección fue propuesto por Rescorla y Solomon en 1967, 
Sin embargo, se desarrolló a partir de ideas ya utilizadas en los años cuarenta, 
especialmente aquellas utilizadas con las teorizaciones sobre los mecanismos del 
aprendizaje de evitación (véase Mowrer, 1960; Rescorla y Solomon, 1967). 
Damos el término «teoría moderna de los dos procesos» a este modelo para 
distinguirlo de la teoría de los dos procesos del aprendizaje de evitación discutido 
en el capítulo 9. La teoría moderna de los dos procesos es similar al mecanismo 
rm-em, en tanto que supone que el condicionamiento clásico es importante para 
motivar la conducta instrumental. Sin embargo, adopta un punto de vista dife- 
rente sobre el condicionamiento clásico y sobre el papel que desempeña el condi- 
cionamiento clásico en la motivación. 

En contraposición al mecanismo rm-em, la moderna teoría de los dos proce- 
sos no considera que el condicionamiento clásico implique el aprendizaje de res- 
puestas concretas ri que contribuya a la motivación general. Antes bien, supone 
que el resultado primordial del condicionamiento clásico consiste en que un estí- 
mulo previamente «neutro» llega a provocar un tipo concreto de motivación, O 
estado emocional central. El estado emocional que un estímulo condicionado 
llega a provocar tiene relación con el tipo concreto de estímulo incondicionado 
que se utilice, y se considera que es una característica del sistema nervioso central 
—un estado de ánimo, si se quiere—. Los estados emocionales no conducen tnva- 
riablemente a respuestas concretas. Por el contrario, se pueden manifestar en 
cualquier acción dentro de una gran variedad. El enfado, por ejemplo, puede dar 
lugar a una pelea, gritos, malhumor o al rechazo de la presencia de alguien cono- 
cido, dependiendo de las circunstancias. 

Dado que los procedimientos de condicionamiento instrumental permiten el 
condicionamiento clásico, la moderna teoría de los dos procesos supone que los 
estados emocionales centrales se condicionan durante el entrenamiento instru- 
mental ordinario. Estos estados se condicionan bien a claves situacionales, o bien 
a estímulos discriminativos que acompañan al procedimiento de reforzamiento. 
Además, se considera que los estados emocionales motivan la conducta iastru- 
mental. El hecho de que los estados emocionales clásicamente condicionados no se 
manifiesten siempre en forma de respuestas iguales convierte a la moderna teoría 
de los dos procesos en mucho menos precisa que el mecanismo rim-em. También 
hace que la medición concurrente de la conducta instrumental y las respuestas 
clásicamente condicionadas sean irrelevantes para la evaluación de la teoría. Ya 
que la moderna teoría de los dos procesos no especifica a qué respuestas lleva un 
estado emocional condicionado, no puede ser refutada con las pruebas proporcio- 
nadas por los experimentos de medición concurrente. 

Si la moderna teoría de los dos procesos no puede ser refutada por los expe- 
rimentos de medición concurrente, ¿cómo puede ser comprobada empíricamente? 
La teoría hace una predicción sobre la conducta nada ambigua y muy importante, 
a saber: la tasa de una respuesta instrumental es modificada por la presentación 
de un estímulo clásicamente condicionado. Esta predicción se basa en las siguien- 
tes consideraciones. Se supone que durante el condicionamiento instrumental se 
desarrolla un estado emocional central condicionado que motiva la respuesta ins- 
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trumental. También se supone que los estímulos condicionados clásicamente pro- 
vocan estados emocionales centrales. Por tanto, al presentarle a un sujero un 
estímulo clásicamente condicionado mientras está ejecutando un programa de 
reforzamiento instrumental, alteraremos el estado emocional que estaba mante- 
niendo la respuesta instrumental. Esto se manifiesta en un cambio en la tasa de la 
conducta instrumental. Hemos visto ya un ejemplo de este efecto en el procedi- 
miento de la respuesta emocional condicionada (REC), descrito en capitulos ante- 
riores. Podemos recordar que en el procedimiento de la REC los animales eran 
entrenados primero a presionar una palanca de respuesta para obtener reforza- 
miento de comida. Un estímulo discreto, tal como una luz o un tono, se empareja 
después de forma repetida con una descarga. Este estímulo de miedo clásicamente 
condicionado se presenta después a los animales mientras presionan la palanca 
para obtener la comida. De acuerdo con las predicciones de la moderna teoría de 
los dos procesos, la presentación del EC condicionado por la descarga produce un 
cambio en la tasa de la respuesta de presión de la palanca: la tasa de presión de la 
palanca para obtener comida desciende. 

Los estímulos clásicamente condicionados no siempre suprimen la conducta 
instrumental como en el procedimiento REC. Según la teoría de los dos procesos, 
el tipo de cambios que producen los distintos tipos de estímulos clásicamente 
condicionados depende del estado emocional creado por esos ECs y de los estados 
emocionales creados por el programa de reforzamiento instrumental. Si el estí- 
mulo clásicamente condicionado produce emociones opuestas a las que motivan la 
conducta instrumental, la tasa de respuesta instrumental desciende. Esto es, pre- 
sumiblemente, lo que ocurre en el procedimiento de REC. El programa de refor- 
zamiento de comida motiva la presión de la palanca a través de un estado emo- 
cional positivo condicionado por la comida. Esta emoción se altera cuando el EC 
condicionado por la descarga se presenta, porque el EC provoca un estado emo- 
cional aversivo. En otras situaciones, el estímulo clásicamente condicionado puede 
provocar una emoción similar al estado emocional creado por el programa de 
reforzamiento instrumenta!. Cuando esto sucede, las dos emociones se suman y la 
tasa de la conducta instrumental aumenta. 


Predicciones específicas de la teoría moderna de los dos procesos. Pueden 
hacerse predicciones específicas sobre la forma en que los estímulos clásicamente 
condicionados influyen en la conducta instrumental considerando las distintas 
emociones que son provocadas por los diversos tipos de ECs y por los programas 
de reforzamiento instrumental. Tomando prestado el lenguaje introducido por 
Mowrer (1960), la tabla 10.1 ofrece una clasificación metafórica de los estados 
emocionales que son, posiblemente, provocados por algunos estímulos clásica- 
mente condicionados bastante comunes. Vamos primero a considerar el condicio- 
namiento clásico con un estímulo incondicionado positivo (apetitivo), tal como la 
comida o el agua. Si el estímulo es un EC+, lo que significa que se asocia con la 
presentación inminente del El, podemos referirnos al estado emocional creado 
por el EC como de esperanza, Por el contrario, si el estímulo es un EC—, lo que 
significa que se ha asociado a la retirada o ausencia del El aperitivo, podemos 
referirnos al estado emocional creado como de decepción. En el caso del EC+ que 
anuncia la presentación inminente de un El aversivo, tal como una descarga, el 
estado emociona! condicionado se llama miedo. Por último, si el estímulo condi- 
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TABLA 10.1. Estados emocionales elicirados por el EC después 
de distintos tipos de condicionamiento clásico 


Estímulo incondicionado 


Esttmato AÁpetitivo Aversivo 
condicionado (como comida) (como descarga) 
E+ Esperanza Miedo 
E— Decepción Alivio 





cionado es un EC — asociado a la retirada o ausencia de un El aversivo, podemos 
suponer que las presentaciones del EC provocan alivio. Utilizando esta misma 
terminología hemos supuesto que la conducta instrumental reforzada por la 
presentación de comida (u otros reforzadores apetitivos) está motivada por la 
«esperanza» y que la conducta instrumental reforzada por la evitación o la reti- 
rada de la descarga (u otros hechos aversivos) está motivada por el «miedo». Es 
importante advertir que esas denominaciones se utilizan sólo por conveniencia, y 
no implican que los ECs pavlovianos que intervienen provoquen necesariamente 
las mismas emociones que las personas experimentan cuando describen sus ser- 
timientos utilizando los términos esperanza, decepción, miedo y alivio. 

Si la presentación de un estímulo clásicamente condicionado altera la conducta 
instrumental únicamente cambiando las emociones que motivan la respuesta Ims- 
trumental, ¿qué debería esperarse en diversas situaciones? La tabla 10.2 ofrece 
una lista de los resultados que podemos esperar cuando los estímulos clásicamente 
condicionados que provocan esperanza, decepción, miedo y alivio se presentan a 
animales que responden*para obtener comida (reforzamiento positivo) o para 
evitar una descarga (reforzamiento negativo). Esas predicciones se basan en la 
suposición de que la esperanza y el alivio (ambas, emociones positivas) y el miedo 
y la desilusión (ambas, emociones negativas) son compatibles una con otra 
(Goodman y Fowler, 1983). Por el contrario, se supone que la esperanza y el 
miedo (y el alivio y la decepción) son incompatibles (Dickinson y Pearce, 1977). 

Vamos primero a considerar las predicciones para el caso del reforzamiento 
positivo (recuadros 1-4). El estado emocional subyacente creado por el reforza- 
miento positivo es el de esperanza. Se supone que la esperanza es incompatible 
con el miedo, y por tanto es de esperar que la tasa de respuesta instrumental 
descienda cuando se presenta un EC+ que señala un El aversivo (recuadro 1). Se 
supone que la esperanza y el alivio son emociones compatibles. Por tanto, prede- 
cimos un aumento en la conducta instrumental positivamente reforzada cuando se 
presenta un EC — para un El aversivo (recuadro 2). En el recuadro 3 se predice 
también que el estímulo clásicamente condicionado facilita la conducta instrumen- 
tal en el recuadro 3 porque, en este caso, el EC provoca esperanza, que constituye 
el mismo tipo de emoción que el estado motivacional creado por el procedimiento 
instrumental. Por el contrario, podemos predecir que la conducta instrumental 
disminuye cuando se presenta un EC —- para la comida (recuadro 4), porque la 
decepción que provoca es incompatible con la esperanza que motiva la conducta 
instrumental. 
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TABLA 10.3, Esquema de los experimentos de transferencia 


de control 
Fase 1 Fase 2 Fase 3 
Condicionamiento ims- Condicionamiento clá- Prueba de transferen- 
trumental de la res- sico del EC cia: durante la ejecu- 
puesta de linea de ción de la respuesta 
base de línea de base se 


presenta el EC 





tal. En algunas aplicaciones del diseño de transferencia del control, se leva a cabo 
la fase de condicionamiento clásico antes del condicionamiento instrumental, En 
algunos otros experimentos, las fases 1 y 2 se realizan al mismo tiempo. Es decir, 
periódicamente se presentan los ensayos de condicionamiento clástco con el EC y 
el El, mientras el sujeto está siendo adiestrado con un programa de reforzamiento 
instrumental. Esas variaciones en el diseño básico a menudo no son importantes 
para los resultados observados en la fase 3, la fase esencial de transferencia. 

La teoría moderna de los dos procesos ha estimulado muchas investigaciones, 
en las que se comprueban predicciones como las de la tabla 10.2 utilizando el 
diseño de transferencia del control. Muchos de los resultados de esos experimen- 
ros han corroborado las predicciones. No se revisarán aquí todos los datos, pero 
citaremos algunos ejemplos ilustrativos. Vamos a considerar, primero, los efectos 
de los estímulos clásicamente condicionados sobre la realización de la conducta 
instrumental mantenida mediante reforzamiento positivo (recuadros 1-4 en la 
tabla 10,2). Como ya hemos advertido, el recuadro 1 representa el procedimiento 
de la respuesta emocional condicionada. La conclusión general consiste en que el 
EC+ condicionado con un El aversivo suprime la tasa de la conducta instrumental 
positivamente reforzada (véase las revisiones de Blackman,1977; Davis, 1968; 
Lyon, 1968). Todavía no se ha investigado extensamente el efecto de una señal de 
ausencia de El aversivo (un EC —) sobre las respuestas positivamente reforzadas 
(recuadro 2). Sin embargo, los datos disponibles de nuevo se corresponden con las 
predicciones. Por ejemplo, Hammond (1966) halló que, en las ratas, la presión de 
la palanca reforzada con comida aumentaba cuando se presentaba un EC — para 
la descarga (véase también Davis. y Shattuck, 1980). En ciertas situaciones, la 
conducta instrumental reforzada con comida aumenta también con la presenta- 
ción de un EC+ para comida, lo que confirma la predicción del recuadro 3 (por 
ejemplo, Estes, 1943, 1948; LoLordo, 1971; Lovibond, 1983). No se ha desarro- 
llado de forma extensa una investigación sobre los efectos de una señal de ausen- 
cla (EC —-) de un reforzador apetitivo sobre las respuestas positivamente refor- 
zadas (recuadro 4). Sin embargo, en algunos estudios (por ejemplo, Gutman y 
Maler, 1978; Hearst y Peterson, 1973) se han obtenido pruebas que sustentan la 
teoría de los dos procesos (una supresión de la respuesta instrumental). 

Se han realizado muchos experimentos para determinar la forma en que 
influyen los estímulos que señalan un El aversivo (EC+) o su ausencia (EC—) 
sobre la tasa de una conducta instrumental negativamente reforzada (recuadros 5 
y 6). Estos estudios apoyan generalmente las predicciones de la teoría moderna de 
los dos procesos. Numerosos estudios han mostrado que la tasa de la conducta de 
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evitación aumenta con la presentación de un EC+ para la descarga, y disminuye 
con la presentación de un EC — para la descarga (por ejemplo, Bull y ER 
1968: Desiderato, 1969; Rescorla y LoLordo, 1963; Weisman y Lirner, 1969). se 
ha observado también que la presentación de una señal para la presencia e 
comida (EC-+) disminuye la tasa de la conducta de evitación PSSS , COMO 
predice el recuadro 7 (por ejemplo, Bull, 1970; Davis y Kreuter, 197 nose, 
Kostansek y Bolles, 1969). No se ha investigado extensamente el efecto y una 
señal de ausencia de comida (EC —) sobre la conducta de evitación Vrecva NN >. 
En un experimento que incluía una prueba sobre la predicción del recua no , NO 
se halló ningún efecto sobre las respuestas de evitación (Bull, 1970). Sin en argo, 
en otro estudio (Grossen y otros, 1969), un EC — clásicamente condiciona: o para 
comida facilitaba la conducta de evitación instrumental, como se predecia en € 


recuadro 8. 


A A AA 
APARTADO 10.1. El miedo y el condicionamiento de alivio: terapias de conducta 


La teoría original de Mowrer de los dos factores es la base histórica de varios rerapias 
de conducta. Estas terapias, normalmente, se proponen modificar las activida es instru- . 
mentales complicadas que se mantienen mediante una gran variedad de retoracores e 
no están bajo el control del terapeuta. El objetivo de la terapia consiste en con: a | 
través del condicionamiento clásico) un estado emocional central al que se transferir e 
control de la conducta instrumental en distintas situaciones fuera de la clínica. La terapia 
de aversión al alcohol, descrita en el capítulo 3, es una de las de este tipo. En este Caso, e 
terapeuta no modifica directamente la conducta instrumental de beber del cliente propor 
cionándole reforzamiento o castigo. Antes bien, algunos aspectos del alcohol (su 0 o. y 
sabor, por ejemplo) se emparejan con la náusea. La esperanza consiste en que se condi- 
cione un estado emocional de aversión a aspectos estimulares del alcohol, y entonces 
inhiba el acercamiento instrumental y la ingestión de alcohol fuera de la clínica. | 

Feldman y MacCulloch (1971) desarrollaron una terapia similar tratando a nome les 
masculinos que deseaban cambiar su orientación sexual, Muchos homosexuales os a 
ajustes satisfactorios de su orientación sexual y no sienten ninguna inclinación por aer 
heterosexuales. Sin embargo, entre los que tienen problemas de adaptación, 4 anos o 
can alterar su orientación sexual. Parte de los procedimientos de Feldman y MacCu loc 
incluían la administración de un estímulo aversivo (una descarga eléctrica) al sujeto mien- 
tras miraba fotografías de hombres desnudos. Se suponía que se condiconaria así una 
respuesta de miedo que inhibiría las respuestas de acercamiento sexual a, os varones 
Además, en algunos ensayos de condicionamiento se presentaba una foto e una ne 
cuando se terminaba la descarga. El propósito de este aspecto del procedimiento era con o 
cionar el alivio a alguna cualidad de «feminidad» presente en las forografías de mujeres. Se 
suponia que esre alivio condicionado intensificaba las respuestas de aproximación 

la clínica. 
e salados de los primeros trabajos con homosexuales parecían ser bastante pro- 
metedores. Sin embargo, otros estudios de los resultados no han resultado tan positivos 
(véase Rachman y Wilson, 1980). Uno de los problemas importantes en e uba Ñ 
terapia de conducta es que cada vez que la conducta no descada se produce fuera e 
clínica el estado emocional condicionado por la descarga (y el alivio de la descarga) sufren 
extinción. Así pues, se ha hallado que el condicionamiento se extingue rápidamente (véase 
Rachman y Teasdale, 1969). Como ocurre con la ingestión excesiva de alcoho de terapia 
para cambiar la orientación sexual precisa un tratamiento de varios aspectos de la con- 
ducta. El condicionamiento del miedo y del alivio constituye sólo una parte de un pro- 
grama más amplio. 


A II4>+<+4A 
A  IA<AAáákl[L << 


92 MICHAEL DOMJAN Y BARBARA BURKHARD 


Interacciones de respuesta en el efecto de los estímulos clásicamente 
condicionados sobre la conducta instrumental 


Las pruebas revisadas arriba ofrecen muchos ejemplos en los que se ha con- 
firmado la teoría moderna de los dos procesos. Sin embargo, otros estudios han 
arrojado resultados que no se corresponden con la teoría moderna de los dos 
procesos y que, a veces, se oponen a ella. Concretamente, esto es lo que sucede 
con el efecto de un EC+ para comida sobre la conducta instrumental positiva- 
mente reforzada (recuadro 3 de la tabla 10.2). La moderna teoría de los dos pro- 
cesos predice un aumento de la conducta instrumental en este caso. Sin embargo, 
muchos investigadores han hallado en cambio una supresión de la conducta, un 
fenómeno que se ha denominado, a veces, supresión condicionada positiva (por 
ejemplo, Azrin y Hake, 1969, Konorski y Miller, 1930; Meltzer y Brahlek, 1970; 
Miczek y Grossman, 1971). Estos hallazgos sugieren que la interacción de los 
estados emocionales centrales no es el único factor que determina el resultado de 
los experimentos de transferencia del control, y en ciertas situaciones puede no 
desempeñar siquiera un papel esencial. 

Los estímulos clásicamente condicionados provocan no sólo estados emociona- 
les, sino también respuestas patentes. Por consiguiente, un estímulo clásicamente 
condicionado puede influir en la conducta instrumental a través de las respuestas 
patentes que provoca. Considérese, por ejemplo, una situación hipotética en la 
que el estímulo clásicamente condicionado hace que el anima] se quede quieto, y la 
respuesta instrumental consiste en ir de un lado a otro de una caja lanzadera. En 
este caso, la presentación del EC disminuirá la respuesta instrumental simple- 
mente porque la tendencia a dejar de moverse provocada por el EC interfiere con 
la conducta de cruzar de un lado a otro. Para entender un resultado así no es 
necesario recurrir a la interacción entre los estados emocionales centrales provo- 
cados por el EC y el programa de reforzamiento instrumental, Si el estímulo 
clásicamente condicionado provocara respuestas patentes, similares a la conducta 
instrumental, la presentación del EC aumentaría las respuestas porque las res- 
puestas provocadas por el EC se añadirían a las respuestas que el animal estaba 
ejecutando para recibir un reforzamiento instrumental. De nuevo sería innecesa- 
ria la suposición de estados emocionales centrales para explicar los resultados. 

Los investigadores han puesto un gran interés en la posibilidad de que los 
resultados de los experimentos de transferencia del control sean debidos al hecho 
de que los ECs pavlovianos provoquen respuestas patentes que interfieran, o faci- 
liten, la conducta requerida para el reforzamiento instrumental. Se han utilizado 
varias estrategias para excluir esta posibilidad (véase Overmier y Lawry, 1979, 
para una revisión reciente). Generalmente, estos esfuerzos han logrado mostrar 
que muchos efectos de transferencia del control no se producen por interacciones 
entre respuestas patentes (véase, por ejemplo, Grossen y otros, 1969; Lovibond, 
1983; Overmier, Bull y Pack, 1971; Scobie, 1972). Sin embargo, las respuestas 
patentes clásicamente condicionadas pueden desempeñar un papel importante en 
algunos experimentos de transferencia del control. 

Es especialmente importante considerar las interacciones de respuesta en dos 
tipos de situaciones. La primera es la de los experimentos de transferencia de 
control en los que se lleva a cabo un condicionamiento clásico con un estímulo 
apetitivo, tal como comida o agua, que el sujeto tiene que obtener en un lugar 
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concreto —por ejemplo, en una taza colocada en una esquina de la cámara 
experimental —. Sí los sujetos tienen que ir a un lugar concreto para obtener el 
El, un EC+ puede suprimir las respuestas instrumentales porque provoca el acer- 
camiento al sitio donde se administra el El (por ejemplo, Karpicke, 1978). 

Las interacciones de respuesta se consideran también muy importantes cuando 
el estímulo clásicamente condicionado es un estímulo discreto localizado (ral 
como un punto de luz) ya que esos ECs provocan seguimiento del signo. Como ya 
advertimos antes, cuando un estímulo localizado se convierte en EC+ para la 
comida, los animales tienden a aproximarse a él. Por el contrario, si el estímulo se 
convierte en un EC+ para la descarga, llega a provocar la retirada, o seguimiento 
del signo negativo (por ejemplo, Leclerc y Reberg, 1980). El seguimiento del 
signo positivo y negativo provocado por los estímulos clásicamente condicionados 
puede aumentar o disminuir las respuestas instrumentales de la línea de base, 
dependiendo de que el seguimiento del signo sea compatible o incompatible con 
la conducta instrumental (por ejemplo, LoLordo, McMillan y Riley, 1974; 
Schwartz, 1976). Esta compatibilidad, a su vez, depende, a menudo, de la localiza- 
ción del estímulo clásicamente condicionado en relación con la localización de la 
respuesta instrumental. 

Un estudio de Karpicke, Christoph, Peterson y Hearst (1977) ilustra, adecua- 
damente, el papel del seguimiento del signo positivo y negativo en los experi- 
mentos de transferencia de control. Unas ratas fueron adiestradas para tirar de 
una cadena suspendida de la parte superior de la cámara experimental, y así obte- 
ner un reforzamiento de leche. Cuando el operante de tirar de la cadena ocurría 
con una tasa estable, se sobrepusieron los ensayos de condicionamiento clásico al 
programa de reforzamiento instrumental. Estos ensayos consistían en encender 
una luz localizada (EC) poco antes de la administración de varias gotas de leche. 
En un grupo de ratas el EC de la luz estaba cerca del tirador de la cadena; en otro 
grupo estaba situada en otra parte de la cámara experimental Después del condi- 
cionamiento, en ambos grupos el EC luminoso alteraba la respuesta instrumental 
de tirar de la cadena. Por tanto, los experimentadores dieron sus resultados en 
términos de razones de supresión (véase capitulo 3). Cuanto más bajo era el valor 
de esta razón, más supresión producía el EC en la respuesta instrumental. Se 
conseguía una puntuación de 0,5 sí la presentación del EC no tenía ningún efecto 
perceptible en las respuestas instrumentales. 
Figura 10.9.—Estudio con ratas 
de la supresión de la respuesta 


de tirar de una cadena, que había 
sido reforzada con leche, cuando 


EC + para leche 





EC + para descarga 


> 
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S A se presenta un EC+ para leche o 
da para descarga. El EC se colocó 
> 0,3 tanto cerca como lejos del tirador 
3 de la cadena. (Valores bajos de la 
É razón de supresión indican gran- 
E de des variaciones en la conducta 
$ instrumental.) (Según Karpicke, 
e 0,1 Christoph, Peterson y Hearsr, 
1977.) 
EC EC EC EC 
Cerca Lejos Cerca Lejos 


394 MICHAEL DOMJAN Y BARBARA BURKHARD 


Los resultados se resumen en el lado izquierdo de la figura 10.9. Cuando el EC 
se colocaba cerca de la cadena, la presentación del EC tenía sólo un pequeño 
efecto desorganizador en la conducta instrumental de tirar de la cadena. Por el 
contrario, cuando el EC se colocaba en otra parte de la cámara experimental, la 
conducta de tirar de la cadena se alteraba mucho más. Una observación más deta- 
llada de los animales indicaba que se producía la supresión de la respuesta porque 
los animales tendían a acercarse al EC. Cuando el EC estaba situado lejos del 
tirador de la cadena, el acercamiento al EC alejaba a las ratas de la cadena, y por 
tanto reducía la conducta de tirar de la cadena. 

El seguimiento del signo provocado por el EC clásicamente condicionado 
puede también determinar los efectos de transferencia de control cuando se con- 
diciona el EC con un El aversivo en vez de apetitivo. Como ya advertimos ante- 
riormente, si un EC+ situado en un lugar determinado se condiciona con un 
estímulo aversivo, tal como una descarga eléctrica, los animales tenderán a ale- 
jarse de él (seguimiento del signo negativo). Karpicke y sus colaboradores (1977) 
repitieron el experimento descrito arriba, con un EC+ condicionado a la descarga, 
que estaba cerca o lejos del lugar donde se ejecutaba la respuesta instrumental. De 
nuevo eran las ratas las que hacían de sujetos y se les entrenó primero a tirar de 
la cadena para obtener leche. Cuando estuvo bien establecido el operante de tirar 
de la cadena, se llevaron a cabo ensayos de condicionamiento clásico en los que la 
presentación de una luz localizada finalizaba con una descarga. En un grupo la luz 
estaba cerca del tirador de la cadena, mientras que en el segundo grupo estaba en 
otra parte de la cámara experimental. Si los animales tienden a alejarse del EC+ 
para descarga, éste desorganizaría la conducta de tirar de la cadena de forma más 
acusada cuando el EC está cerca de la cadena que cuando está lejos. 

Los resultados vienen resumidos en el panel derecho de la figura 10.9. Como 
predecía la hipótesis de la interacción de las respuestas, el EC+ desorganizaba 
mucho más la respuesta instrumental de tirar de la cadena cuando estaba cerca de 
la cadena que cuando estaba lejos. Es interesante advertir que este efecto es el 
contrario del que se producía cuando el EC se condicionaba con la leche (panel 
izquierdo de la figura 10.9). En ese caso, el EC que estaba situado lejos desorgani- 
zaba la conducta de tirar de la cadena más que el EC que estaba cerca. Así pues, la 
situación del EC no es el único determinante del efecto que produce el EC sobre la 
conducta de tirar de la cadena. Antes bien, los resultados de la transferencia del 
control dependen de que el EC se haya condicionado con un reforzador positivo O 
negativo (leche o descarga) y de que el seguimiento del signo provocado por el 
EC haga que el animal se aleje del lugar donde se tiene que ejecutar la respuesta 
instrumental. 

Los experimentos sobre el papel del seguimiento del signo en los estudios de 
transferencia de control son significativos porque muestran que las interacciones 
emocionales sobre las que hace hincapié la teoría moderna de los dos procesos no 
pueden explicar todos los resultados de transferencia del control. Sin embargo, es 
importante recordar que los experimentos de transferencia del control no implt- 
can invariablemente interacciones de respuestas determinadas por la retirada o 
acercamiento al EC o por el acercamiento al lugar donde se presenta el El. En un 
reciente estudio con conejos, por ejemplo, Lovibond (1983) eliminaba la aproxi- 
mación al lugar donde se administra el El utilizando como El una solución de 
azúcar que se introducía directamente en la boca del animal a través de una cánula 
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implantada permanentemente en su mejilla. Las respuestas dirigidas al EC pue- 
den igualmente minimizarse utilizando estímulos que no puedan localizarse en el 
ambiente exterior (la iluminación difusa de toda la cámara experimental, por 
ejemplo). 


Las propiedades estimulares discriminativas de los estados clásicamente 
condicionados 


Hemos descrito los resultados de muchos experimentos que muestran que los 
estímulos clásicamente condicionados pueden influir en la ejecución de la con- 
ducta instrumental. Al analizar esos efectos, hemos remarcado dos aspectos de los 
estímulos clásicamente condicionados: el estado emocional o tipo particular de 
motivación provocado por los estimulos, y las respuestas patentes que esos estí- 
mulos provocan. Sin embargo, la explicación de todas las formas en que los estí- 
mulos clásicamente condicionados pueden influir sobre la conducta instrumental 
requiere postular también una tercera variable. Debemos suponer que los estímu- 
los clásicamente condicionados provocan un estado teórico que posee mo sólo 
propiedades elicitadoras de respuesta y motivacionales concretas sino también 
características estimulares. La idea consiste en que el estado de excitación neuro- 
lógica en el cerebro, provocado por los estímulos clásicamente condicionados, 
conduce a sensaciones concretas, además de provocar tipos particulares de moti- 
vación (emociones) y respuestas patentes. Esas sensaciones pueden llegar a hacer 
de estímulos discriminativos en la conducta instrumental, y por tanto influir en el 
rendimiento instrumental. 

¿Cómo podrian los estados clásicamente condicionados adquirir propiedades 
estimulares discriminativas? Teóricamente, la respuesta es bastante simple. En el 
capitulo 8 se expuso que un estímulo adquiere un control discriminativo de la 
conducta si se refuerzan las respuestas en presencia del estímulo y se dejan de 
reforzar en su ausencia. Igualmente, las características estimulares de un estado 
clásicamente condicionado deberían adquirir un control discriminativo de la con- 
ducta instrumental mediante el reforzamiento diferencial. Sin embargo, esto es 
más fácil decirlo que probarlo experimentalmente. La demostración experimental 
se complica por el hecho de que no podemos manipular directamente las caracte- 
rísticas estimulares de los estados clásicamente condicionados; no podemos pre- 
sentar y retirar a voluntad esos estímulos como podernos encender y apagar una 
luz o un sonido. 

Un enfoque experimental del estudio de las propiedades estimulares discrimi- 
nativas de los estados clásicamente condicionados implica un procedimiento de 
discriminación instrumental. Considérese, por ejemplo, el procedimiento que se 
presenta en el diagrama de la figura 10.10. Los sujetos se colocan en una caja 
lanzadera de doble dirección: son reforzados con comida por cruzar de un lado al 
otro cuando suena un chasquido, y no son reforzados en ausencia del chasquido. 
Asi pues, el chasquido se convierte en un E + apetitivo. Dado que los sujetos 
reciben comida durante el E + (y no durante su ausencia), el E + también se 
condiciona clásicamente con comida y podemos suponer que llega a provocar un 
estado clásicamente condicionado, que se indica con el símbolo T en la parte 
inferior de la figura 10.10, Presumiblemente, el estado T clásicamente condicio- 
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Procedimiento Figura 10.10.—Procedimiento y 
mecanismo teórico para el entre- 
namiento de discriminación de 

E + (repiqueteo) Comida E— (no repiqueteo) No comida la respuesta de cruzar de un lado 
a otro (R). Esta acción es refor- 
zada con comida mientras suena 
un repiqueteo (E+), y no es 

R R reforzada en ausencia del repi- 

(cruzar) (cruzar) queteo (E—-). E+ provoca un 

estadio T clásicamente condicto- 
nado que posee propiedades es- 
timulares eT. La respuesta ims- 
trumental puede ser desencade- 
nada por E+ tanto direcramente 

(flecha 4) como por medio de las 


Mecanismo teórico 


E+ Comida propiedades estimulares discrirmi- 
: nativas del estado clásicamente 
l ñ condicionado (flecha b). 

] 

PE o R 


nado posee características estimulares que vienen indicadas en la figura 10.10 por 
eT. Esas sensaciones (eT) están presentes cuando se refuerza la respuesta imstru- 
mental porque el estado clásicamente condicionado (T) está provocado por el E+. 
Sin embargo, las sensaciones eT no están presentes en los ensayos no reforzados 
porque el E — no está condicionado para provocar el estado T clásicamente con- 
dicionado. La presencia de eT' en los ensayos reforzados pero no en los no refor- 
zados puede capacitar a los estímulos para hacer de claves discriminativas de la 
respuesta instrumental, como viene indicado por la flecha b en la parte inferior 
de la figura 10.10. 

El esquema presentado en la figura 10.10 hace verosímil que durante el entre- 
namiento de discriminación las propiedades estimulares (eT) de un estado clási- 
camente condicionado puedan adquirir un control discriminativo sobre la con- 
ducta instrumental. Sin embargo, de acuerdo con el modelo teórico trazado en la 
figura 10.10, existen dos medios por los que el E + puede llegar a provocar la 
respuesta instrumental, El E + puede provocar, directamente, la respuesta ins- 
trumental, como viene indicado por la flecha a en la parte inferior de la figura, o 
puede provocar la respuesta indirectamente, a través de las propiedades estimula- 
res del estado clásicamente condicionado (flecha b). Por tanto, observar que los 
sujetos dan la respuesta de cruzar de un lado a otro durante el E + y no durante 
el E —, no nos dice especificamente que las propiedades estimulares eT' del 
estado clásicamente condicionado hayan conseguido un control discriminativo 
sobre la conducta. La conducta provocada por el E + podría simplemente haber 
ocurrido también por una conexión directa entre el E + y la respuesta. 

Para probar que eT puede provocar la respuesta instrumental por sí mismo 
tenemos que presentar eT' sin el E +. En este caso, cualquier respuesta de lanza- 
dera que se observe debe atribuirse solamente al eT. Pero ¿de qué forma puede 
esto hacerse si no tenemos un control directo sobre eT? Una posibilidad es condi- 
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cionar un estímulo diferente del E + para provocar también el estado T clásica- 
mente condicionado. Vamos a añadir una segunda fase al experimento que hemos 
estado considerando. Después del adiestramiento discriminativo de la respuesta 
de lanzadera que hemos llevado a cabo con el chasquido como E +, meteremos al 
animal en un aparato claramente diferente y llevaremos a cabo un condiciona- 
miento clásico simple en el que se empareja un sonido puro (EC+) con la presen- 
tación de comida, y se da un sonido puro diferente (EC —) sin comida. Este 
procedimiento, junto con la primera fase del experimento que hemos estado con- 
siderando, está resumido en la figura 10.11. Recuérdese que en la fase segunda del 
experimento sólo tiene lugar el condicionamiento clásico. No se pide al sujeto 
que realice ninguna respuesta instrumental concreta para que se le administre 
comida. Las respuestas de lanzadera no se refuerzan en esta fase del experimento. 
De hecho, el experimento se desarrolla en un aparato en el que el sujeto no cruza 
de un lado a otro. Así pues, en la segunda fase lo único que ocurre es que un tono 
se convierte en EC+ para la comida y el toro en un EC— para la comida. 
Tanto la fase 1 como la fase 2 del experimento de la figura 10.11 implican un 
condicionamiento con comida. Por tanto, el EC+ del sonido puro llega posible- 
mente a provocar el mismo estado T clásicamente condicionado en la fase 2 que 
el que fue condicionado al E + en la fase 1. Podemos suponer que, después de 
condicionar el EC+-, el EC+ provocará el estado T clásicamente condicionado, con 


Fase 1 (caja lanzadera) Figura 10,11.—Esquema del ex- 
perimento de Overmier y Lawry 
E+ (repiquereo) Comida E — (no repiqueteo) No comida (1979). En la fase 1 el entrena- 
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Fsgura 10.12.—Tanto por ciento 
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las propiedades estimulares eT que le acompañan. Esto nos lleva al aspecto más 
importante de este complicado experimento. Recuérdese que estamos tratando de 
probar que las propiedades estimulares eT del estado clásicamente condicionado 
llegan a hacer de estímulos discriminarivos para la respuesta de lanzadera en la 
fase 1 del experimento. Si esto es así, en cualquier momento que el sujeto expe- 
rimente eT dentro de la caja lanzadera, los cruces de un lado a otro deberían 
aumentar. Por tanto, la presentación del EC+ condicionado a la comida debería 
provocar un aumento en las respuestas de lanzadera. Además, se espera este 
resultado aun cuando en ese momento el sujeto no responda para obtener refor- 
zamiento positivo. 

El experimento que hemos estado describiendo fue llevado a cabo por Over- 
mier y sus colaboradores (véase Overmier y Lawry, 1979). Los sujetos eran 
perros. Al describir el estudio omitimos varios aspectos para simplificar la pre- 
sentación. Entre las fases 1 y 2 del experimento los sujetos recibían entrena- 
miento de evitación de operante libre en la caja lanzadera en presencia de una luz 
brillante. (En este caso cada respuesta de lanzadera posponía la siguiente descarga 
programada 30 segundos.) Este programa de evitación de operante libre se puso 
en marcha durante la fase final del experimento, en la que se presentó el EC+ 
condicionado a la comida en la caja de lanzadera. El punto de interés era sí los 
cruces de un lado a otro aumentaban por la presentación del EC+. La prueba final 
sobre transferencia también incluía la presentación del EC — condicionado a la 
comida. 

La figura 10.12 resume los resultados. Los datos se expresan en términos de 
porcentaje de cambio (aumento o disminución) en las respuestas de lanzadera 
originado por la presentación de los estímulos EC+ y EC— condicionados a la 
comida. Durante las presentaciones de los estímulos, el programa de evitación de 
operante libre seguía vigente para la conducta de lanzadera. 

Como muestra la figura 10.12, la presentación del EC+ condicionado a la 
comida aumentó las respuestas de lanzadera. Este hallazgo es muy significativo 
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porque no puede explicarse mediante las propiedades emocionales del estado 
provocado por el EC+, ni mediante las respuestas provocadas por el EC+. Ya que 
el EC-F fue condicionado con comida, el estado emocional que provocaba (la espe- 
ranza) debería de haberse sustraído de la emoción (miedo) que mantiene la con- 
ducta de evitación de la línea de base, y debería de haberse producido un descenso 
en la conducta de lanzadera. Las respuestas condicionadas al EC+ no pueden : 
explicar el aumento de la conducta de lanzadera, ya que el EC+ fue condicionado 
en un procedimiento de condicionamiento clásico y se tomaron precauciones 
especiales para asegurar que la respuesta de lanzadera no se condicionaba al EC+ 
en la segunda fase del experimento. El aumento de las respuestas provocado por 
el EC-+ se explica mejor por las propiedades estimulares discriminativas (eT) del 
estado clásicamente condicionado (Y) provocado por el EC+. Esas claves (eT) 
probablemente conseguían un control sobre la respuesta de lanzadera debido al 
entrenamiento que los sujetos recibían en la fase 1 del experimento. 

Vamos a considerar lo que ocurrió cuando el EC — condicionado a la comida 
se presentó en la prueba sobre transferencia. Esta vez se produjo un pequeño 
descenso en la conducta de lanzadera. Esta es una observación importante acerca 
del control porque muestra que en esta situación no todos los estímulos producen 
aumentos en la respuesta. Por tanto, podemos estar seguros de que el efecto 
observado con el EC+ se debió a la historia específica de condicionamiento de ese 
estímulo. 

Overmier y sus colaboradores han llevado a cabo varios experimentos del tipo 
de los que se han descrito (véase Overmier y Lawry, 1979). Estos estudios pro- 
porcionan un fuerte apoyo a la idea de que los estados clásicamente condicionados 
poseen propiedades estimulares que pueden adquirir un control discriminativo 
sobre la conducta instrumental. Además, las propiedades discriminativas de los 
estados clásicamente condicionados pueden invalidar las propiedades emocionales 
de los estados, como en el experimento que acabamos de describir, 

Es interesante advertir que el presente análisis teórico en términos de las 
propiedades estimulares discriminativas de los estados clásicamente condiciona- 
dos (véase figura 10.10) es muy similar al mecanismo rm-em discutido anterior- 
mente (véase figura 10.5). Como en el mecanismo r7m-em, se considera que los 
estímulos presentes durante el condicionamiento instrumental (E +) se condicio- 
nan clásicamente, y se supone que la entidad clásicamente condicionada posee 
características estimulares que llegan a hacer de claves discriminativas para la 
respuesta instrumental. Así pues, el presente modelo tiene el mismo tipo de fun- 
ción directiva de la respuesta que el que habíamos discutido anteriormente en 
conexión con el mecanismo de respuesta fraccional anticipatoria de la meta. Sin 
embargo, la presente explicación difiere del mecanismo r:m-esm al considerar que 
se adquiere un estado mediador clásicamente condicionado (IT) en vez de la res- 
puesta fraccional anticipatoria de meta (rg). Además, en el modelo teórico con- 
temporáneo se supone también que la entidad condicionada clásicamente provo- 
cada por el E + posee propiedades emocionales que pueden añadirse o sustraerse 
de otras emociones provocadas, de acuerdo con la teoría moderna de los dos 
procesos. 
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¿Estados emocstonales centrales condicionados o expectativas específicas 
de recompensa? 


La teoría moderna de los dos procesos sostiene que el condicionamiento clá- 
sico medía en la conducta instrumental a través del condicionamiento de estados 
emocionales centrales como la esperanza, la desilusión, el miedo y el alivio. Sin 
embargo, aumenta el número de pruebas que indican que, en ciertas situaciones, 
los animales adquieren durante el condicionamiento clásico e instrumental expec- 
tativas especificas de recompensa en vez de estados emocionales centrales genera- 
les (Peterson y Trapold, 1980). Baxter y Zamble (1982), por ejemplo, compara- 
ron la estimulación eléctrica del cerebro (EEC) y la comida como recompensas en 
experimentos de transferencia de control con ratas. Ya que esos dos Els son 
reforzadores positivos, se debería esperar que condicionaran el estado emocional 
de la esperanza. Baxter y Zamble hallaron que un EC+ que señalaba estimulación 
cerebral aumentaba la presión instrumental de la palanca reforzada con EEC, y 
que un EC+ para la comida aumentaba la presión de la palanca reforzada con 
comida. Sin embargo, un EC+ para la EEC no aumentaba la presión de la palanca 
condicionada con un reforzamiento de comida. Así pues, un estímulo positivo 
clásicamente condicionado aumentaba las respuestas instrumentales sólo si seña- 
laba el mismo El que había sido utilizado para condicionar la respuesta ins- 
trumental, 

En otro estudio con ratas se utilizaron bolitas de comida sólidas y una solución 
azucarada como Els para el condicionamiento clásico e instrumental (Kruse, 
Overmier, Konz y Rokke, 1983). Los resultados mostraron que un EC+ anuncia- 
dor de comida tenía un efecto facilitador mucho mayor sobre las respuestas ins- 
trumentales reforzadas con comida que sobre la conducta instrumental reforzada 
con una solución de azúcar. De forma similar, un EC+ para el azúcar tenía un 
efecto facilitador mayor sobre la conducta instrumental reforzada con azúcar que 
sobre la conducta instrumental reforzada con bolitas de comida. Así pues, en el 
estudio de Baxter y Zamble (1982), los resultados estaban determinados más por 
las expectativas específicas de recompensa que por un estado emocional central 
más general de esperanza (véase también Hendersen, Patterson y Jackson, 1980). 

Los estudios descritos arriba indican claramente que en determinadas circuns- 
tancias, los animales adquieren, durante el condicionamiento clásico y el instru- 
mental, expectativas específicas de reforzador más que estados emocionales gene- 
rales. El aprendizaje de una expectativa específica de reforzamiento es una 
alternativa que desafía la teoría moderna de los dos procesos en la explicación de 
ciertos resultados. En particular, la teoría de la expectativa logra explicar más 
satisfactoriamente los resultados de los experimentos de transferencia del control 
en los que los Els utilizados durante las fases del condicionamiento clásico e ins- 
trumental son del mismo tipo —ambos aversivos o ambos apetitivos— (recua- 
dros 3, 4, 5 y 6 de la tabla 10.2). Si los Els empleados son idénticos en las dos 
fases (el condicionamiento clásico y el instrumental con el mismo tipo de comida, 
por ejemplo), entonces son idénticas las predicciones de la teoría de la expectativa 
y la teoría de los dos procesos. Si los Els no son idénticos pero son de la misma 
categoría afectiva (bolitas de comida y sucrosa, por ejemplo) las pruebas que des- 
cribimos arriba indican que la teoría de la expectativa logra explicar más satisfac- 
toriamente los resultados que la teoría de los dos procesos. 
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Estas consideraciones sugieren que la teoría de la expectativa podría reempla- 
zar a la teoría moderna de los dos procesos en la explicación de muchos hallazgos. 
Sin embargo, la teoría de la expectativa no logra explicar con tanto éxito como la 
teoría de los dos procesos los efectos del condicionamiento clásico sobre la con- 
ducta instrumental, cuando los Els utilizados en los dos tipos de condicionamiento 
provienen de sistemas afectivos opuestos (comida y descarga, por ejemplo). (Esos 
ejemplos se ilustran en los recuadros 1, 2, 7 y 8 de la tabla 10.2.) Por ejemplo, no 
está claro, si nos basamos en las expectativas de un reforzamiento específico, por 
qué un EC — que señala la comida debería facilitar la conducta instrumental de 
evitación de la descarga (recuadro 8 de la tabla 10.2). La expectativa de un refor- 
zador específico provocada por un EC — anunciador de cornida no es ciertamente 
la misma que la expectativa específica de un reforzador presumiblemente respon- 
sable de la conducta instrumental de evitación de la descarga. Sin embargo, la 
emoción provocada por un EC — anunciador de comida (la desilusión) es similar 
a la emoción que presumiblemente se adquiere durante el entrenamiento de evi- 
tación (el miedo). Por tanto, la teoría de los dos procesos logra explicar con más 
éxito esos resultados de transferencia. 


COMENTARIOS FINALES 


Los procedimientos de condicionamiento clásico e instrumental son clara- 
mente diferentes uno de otro. Sia embargo, el reforzamiento instrumental puede 
intervenir en los procedimientos de condicionamiento clásico, y los procesos de 
condicionamiento clásico pueden intervenir en los procedimientos de condicio- 
namiento instrumental. Las investigaciones experimentales han mostrado que el 
condicionamiento clásico puede tener lugar en ausencia de una oportunidad para 
el reforzamiento instrumental. Sin embargo, no pueden llevarse a cabo investiga- 
ciones comparables para mostrar que es posible el condicionamiento instrumental 
sin que se produzca condicionamiento clásico. 

Todos los procedimientos de condicionamiento instrumental permiten la pre- 
sencia del condicionamiento clásico. Los experimentos de medición concurrente 
confirmaron que durante los procedimientos de condicionamiento instrumental se 
desarrollan de hecho respuestas clásicamente condicionadas. Sin embargo, las 
medidas concurrentes de las respuestas condicionadas clásica e instrumentalmente 
no han probado ser muy útiles para dilucidar la interrelación de estos dos proce- 
sos. Otra técnica experimental, el diseño de la transferencia del control, ha pro- 
porcionado mucha más información esclarecedora. Este tipo de experimento ha 
confirmado, en muchos casos, el principio básico de la teoría de los dos procesos: 
que los estímulos clásicamente condicionados pueden influir en la ejecución de 
una respuesta instrumental establecida independientemente. La investigación ha 
demostrado que la transferencia de control desde los estímulos condicionados pav- 
lovianos a la conducta instrumental está gobernada por varios factores. Un factor 
importante es la naturaleza del estado emocional central provocado por el E€ 
pavloviano en comparación con el estado emocional central que se establece 
mediante el programa de reforzamiento instrumental de la línea de base. (La 
teoría moderna de los dos procesos ha destacado este factor.) Una segunda varia- 
ble importante la constituyen las respuestas patentes provocadas por el EC pav- 
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loviano, y hasta qué punto son éstas compatibles o incompatibles con la conducta 
instrumental. Un tercer factor en los experimentos de transferencia del control es 
el que constituyen las propiedades estimulares discriminativas de los estados clá- 
sicamente condicionados. (Teorías semejantes al mecanismo rm-em han desta- 
cado este factor.) Por último, en los experimentos de transferencia del control 
pueden también intervenir las expectativas específicas de un reforzador. Por lo 
general, los experimentos concretos de transferencia del control han sido diseña- 
dos para aclarar la importancia de una variable concreta. Por tanto, los resultados 
de los experimentos individuales proporcionan, a menudo, pruebas que se corres- 
ponden con sólo una de las perspectivas existentes sobre la interrelación del con- 
dicionamiento clásico y el instrumental. Sin embargo, todas las pruebas sugieren 
que la interacción de los procedimientos de condicionamiento clásico e instrumen- 
tal está determinada de forma múltiple. 


Capitulo 11 


LA COGNICIÓN ANIMAL: MECANISMOS 
DE LA MEMORIA 


En el capítulo 11 vamos a comenzar a considerar un área de reciente y rápido 
desarrollo, relacionada con el estudio del aprendizaje y de la conducta: la cogni- 
ción animal. Después de definir la cognición animal y describir las razones para 
su estudio, discutiremos uno de los aspectos más importantes de la cognición: la 
memoria. Vamos primero a describir la memoria de trabajo y las modificaciones 
de la memoria debidas a la experiencia, pues los procesos que intervienen en 
estos aspectos de la memoria son distintos de los del aprendizaje. El capítulo 
termina con una discusión sobre las interacciones entre aprendizaje y memoria. 


¿QUE ES LA COGNICIÓN ANIMAL? 
¿POR QUE ESTUDIAR LA COGNICION ANIMAL? 
LOS MECANISMOS DE LA MEMORIA EN LA CONDUCTA ANIMAL 
Memoria de trabajo y memoria de referencia 
Investigaciones sobre la memoria de trabajo 
Ajuste demorado a la muestra 
Determinantes procedimentales del ajuste demorado a la muestra 
Estrategias de respuesta en el ajuste a la muestra 
El aprendizaje de regla específica frente al de regla general 
El proceso de memoria activo frente al pasivo 
La memoría espacial en un laberinto radial 
Los mecanismos que rigen la actuación en el laberinto radial 
Mapa espacial frente a memoria serial de una lista 
Duración y especificidad del contexto de la memoria de trabajo espacial 
Particularidades de las especies en la memoria espacial dentro del labe- 
rinto radial 
La memoria espacial en la recuperación de comida escondida en las aves 
Alteración y facilitación de la memoria 
La interferencia proactiva y la interferencia retroactiva 
El olvido dirigido 
Medios neurofisiológicos de alterar la memoria 
La facilitación de la recuperación de la memoria con tratamientos 
«recordatorios» 
Interrelaciones del aprendizaje y la memoria 
Reconsideraciones de la curva de aprendizaje 


Teoría del repaso 


Los fenómenos de carga y habimación 


Carga y condicionamiento clásico 
COMENTARIOS FINALES 


Uno de los adelantos contemporáneos más notables en el estudio del condi- 
cionamiento y del aprendizaje lo constituye el renovado interés en los procesos 
cognitivos de la conducta animal (por ejemplo, Griffin, 1976, 1982; Hulse, Fow- 
ler y Honig, 1978; Roitblat, Bever y Terrace, 1984). Aunque los problemas cog- 
nitivos de la conducta animal se tomaron en consideración hace ya muchas déca- 
das (por ejemplo, Tolman, 1932), esos conceptos no se han utilizado exten- 
samente en los análisis científicos de la conducta animal hasta muy reciente- 
mente. Este resurgimiento del interés por los conceptos cognitivos puede deberse 
a dos descubrimentos coincidentes. En primer lugar, la investigación sobre con- 
ducta animal ha mostrado que el estricto enfoque E-R de los conductistas mo 
proporciona un marco conceptual totalmente adecuado para ciertos aspectos de la 
conducta animal. En segundo lugar, en los últimos 20 años se han realizado gran- 
des avances en el desarrollo del enfoque científico para el estudio de las funciones 
cognitivas humanas. El significativo éxito alcanzado en la investigación experi- 
mental de la conducta cognitiva humana ha fomentado investigaciones similares 
en conducta animal. 


¿QUE ES LA COGNICION ANIMAL? 


La palabra cognición viene del latín y significa «conocimiento o pensa- 
miento». En lenguaje común se utiliza para hacer referencia a los procesos de 
pensamiento. Para la mayoría de la gente, los procesos de pensamiento tienen dos 
caracteristicas sobresalientes. En primer lugar, tendemos a considerar que el pen- 
samiento implica el tratamiento consciente, deliberado y voluntario de un tema, 
lo cual incluye normalmente el uso del lenguaje. Así pues, el pensamiento se 
considera informalmente como una forma de «hablar con uno mismo». La 
segunda característica sobresaliente del pensamiento es que puede conducir a 
acciones que no pueden explicarse basándose en los estímulos externos que la 
persona experimenta en ese momento. Por ejemplo, cuando vamos camino del 
trabajo nos podemos acordar de que no cerramos con llave la puerta al marchar- 
nos de casa. Este pensamiento podría dar lugar a que volviéramosa casa y cerrá- 
ramos la puerta con llave. Nuestra vuelta a casa no podría explicarse por los 
estímulos externos a los que estamos expuestos cuando vamos a trabajar. Cada día 
nos encontramos estos mismos estímulos, pero éstos mo nos hacen volver a casa. 
Antes bien, atribuimos nuestra conducta al pensamiento de la puerta no cerrada 
con llave. 

En el estudio científico de la conducta animal, el término cogrición se utiliza 
en un sentido más estricto que en el lenguaje común, No ha surgido un consenso 
claro en relación con la definición de cognición animal. Sin embargo, la cogni- 
ción animal no se define como una reflexión voluntaria o consciente sobre un 
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tema. Más precisamente, la cognición animal alude al uso de una representación 
neurológica, o modelo, de alguna experiencia pasada como base para la acción. 
Una representación neurológica (registro o imagen «mental», si se quiere) no 
puede investigarse directamente mirando dentro del sistema nervioso, sino que se 
infiere de la conducta. Ási pues, el término representación interna es un concepto 
teórico, en el mismo sentido en que, por ejemplo, la gravedad es un concepto 
teórico inferido de la conducta de caída de los objetos (véase Roitblat, 1982, para 
una discusión más detallada). Las representaciones internas pueden codificar 
varios tipos de información, tales como características particulares de los estímu- 
los o relaciones entre hechos experimentados anteriormente. El concepto de 
representación interna es útil porque nos permite explicar la aparición de res- 
puestas que no están totalmente gobernadas por los estimulos externos. La con- 
ducta puede estar guiada por representaciones internas de hechos y relaciones 
más que por estimulos externos concretos. Consecuentemente, a menudo se i11vo- 
can los mecanismos cognitivos cuando las acciones de un animal no pueden ser 
explicadas totalmente en función de los estímulos externos a los que el animal 
está expuesto en ese momento. 

Ásumir que el animal posee procesos cognitivos no debe llevarnos a decir que 
también posee conciencia. Como Terrace (1984, pág. 8) ha comentado rectente- 
mente, «para que el estudio de los procesos cognitivos en los animales se base en 
principios racionales, no se debe hacer referencia a la conciencia del animal». Las 
investigaciones sobre cognición animal se centran en cuestiones tales como de qué 
manera se forman las representaciones neurológicas, qué aspectos de la experien- 
cia codifican, cómo se almacena la información, cómo se utiliza después para guiar 
la conducta. Estas cuestiones se tratan con el mismo rigor experimental que cual- 
quier otra cuestión objeto de investigación que implique hacer inferencias teóricas 
de la conducta observada. 

La cognición interviene claramente en la memoria, que vamos a discutir en 
este capítulo, y en el aprendizaje de patrones seriales, en la formación de concep- 
tos, en el razonamiento y en el lenguaje, temas todos que trataremos en el capí- 
tulo 12. Sin embargo, la cognición también es impottrante en el condicionamiento 
clásico e instrumental. Gran parte de nuestra discusión sobre condicionamiento 
clásico de los capitulos 3 y 4 adopraba la fuerte orientación cognitiva que ha 
adquirido la investigación contemporánea en este área. Como advertimos en el 
capítulo 4, la investigación sobre condicionamiento clásico sugiere que los anima- 
les no aprenden a dar una respuesta concreta al EC. Antes bien, aprenden 174 
asociación entre dos estímulos, el EC y el El (una asociación E-E). El enfoque E-E 
sostiene que la respuesta condicionada no está provocada directamente por el EC, 
sino que el EC provoca o activa una representación («imagen mental») del El, y 
la respuesta condicionada se ejecuta a causa de esta representación. Si la represen- 
tación del El se altera independientemente, la respuesta provocada por el EC se 
altera también (véase «Enfoques modernos de la sustitución del estímulo» en el 
capítulo 4). 

Hemos mencionado también algunos mecanismos cognitivos en el condicio- 
namiento instrumental. La hipótesis de la indefensión aprendida, por ejemplo, es 
una formulación cognitiva. Como ya advertimos en el capítulo 5, según la hipóte- 
sis de la impotencia adquirida, los sujetos expuestos a una estimulación aversiva, 
de la que no pueden escapar y que no pueden evitar, aprenden que el hecho 
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aversivo es independiente de su conducta. Adquieren una representación o con” 
cepción del ambiente según la cual su conducta no puede contro A a em 
ción aversiva. La hipótesis del aprendizaje relacional, discutida en e capítulo 8, es 
también un mecanismo cognitivo. La relación concreta entre dos mos (uno 
más grande que el otro, por ejemplo) no es resultado de un atribo ico 0 
ninguno de ellos. Para responder en base a una relación entre e oo os, a 
sujetos tienen primero que abstraer ciertas Caracteristicas de aa, so 
(tamaño, por ejemplo) y después comparar esas caracterisuicas ' si pe e 
aprendizaje relacional requiere la formación de representaciones de lOs €Stl 


presentes en la situación. 


¿POR QUE ESTUDIAR LA COGNICION ANIMAL? 


Como ya advertimos antes, el interés por los procesos coguitivos de la on 
ducrta animal fue consecuencia de los grandes avances en la comprensión e A 
funciones cognitivas humanas. Esto plantea una cuestión interesante: Si ya 5 0 
mos mucho sobre la cognición humana, ¿por qué estudiar la cognición e o 
animales? Existen varias razones convincentes. Primero, aunque sabemos mucno 
sobre cognición humana, no sabemos de qué forma llegan los os a MA 
sus capacidades cognitivas: no sabemos mucho sobre la evolución de . Cog ción: 
La información sobre la evolución de la cognición y el pensamiento sólo se O 
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APARTADO 11.1. ¿Qué tal recuerdan los mños pequeños? 
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drá mediante una cuidada investigación animal comparativa que incluya diferen- 
tes especies. El actual resurgimiento del interés por la cognición animal refleja un 
resurgimiento del interés por la psicología comparativa y las cuestiones sobre la 
evolución del procesamiento de la información, del pensamiento y de la mente 
(Wasserman, 1981la). A menudo, suponemos a la ligera que los humanos poseen 
capacidades únicas para formar representaciones simbólicas y utilizarlas en la 
comunicación y en el razonamiento. De hecho, a veces asumimos que nuestras 
habilidades cognitivas altamente desarrolladas son las que mos convierten en 
humanos. El estudio de la evolución de la cognición a través del trabajo compara- 
tivo con animales es importante para situar la conducta cognitiva humana en una 
perspectiva biológica adecuada, y puede permitirnos entender en qué medida 
nuestras capacidades cognitivas contribuyen a nuestra humanidad. 

El estudio de la cognición animal promete también contribuir a la investiga- 
ción de la neurofisiología de la conducta cognitiva. Las intervenciones neurofisio- 
lógicas, a menudo, no son posibles con sujetos humanos (ni deberían serlo), por 
razones éticas. Sin embargo, la información sobre neurofisiología de la cognición 
es importante para permitir a los médicos evaluar y tratar los desórdenes cogniti- 
vos y a predecir los efectos potenciales de las medicaciones y de los procedimien- 
tos médicos sobre el funcionamiento cognitivo. Para ayudar a llenar esta laguna 
del conocimiento, se desarrollaron modelos animales que se han utilizado en la 
investigación de la neurofisiología de la cognición (por ejemplo, Martínez, Jensen 
y McGaugh, 1981; Pribram, 1984). 

Otra área en la que el estudio de la cognición animal puede realizar una 
importante contribución es la construcción de máquinas inanimadas de pensa- 
miento. El incremento de la automatización y de la informatización de muchas 
formas de trabajo humano ha venido acompañado de un aumento de interés en 
las máquinas de pensar inanimadas (robots) y en la inteligencia artificial. Dada la 
complejidad del sistema nervioso humano, es difícil usarlo como modelo para el 
diseño de los sistemas de inteligencia artificial. Sin embargo, las máquinas de 
pensar manimadas podrían diseñarse a partir de animales que tengan un sistema 
nervioso mucho más simple. Los estudios sobre las capacidades cognitivas de esos 
organismos podrían ofrecer información sobre lo que puede llegar a lograrse con 
sistemas simples.' 

La investigación sobre la cognición animal es también útil en el sentido que 
proporciona técnicas que pueden utilizarse para encarar ciertas cuestiones sobre la 
conducta humana. Un área particularmente fértil en este aspecto es el estudio de 
los procesos cognitivos en personas retardadas y en niños prelingiísticos. La 
mayoría de los procedimientos que se utilizan para el estudio de la cognición de 
los humanos adultos no pueden emplearse con niños pequeños. Sin embargo, 
existen procedimientos desarrollados en la investigación animal que pueden adap- 
tarse para este propósito, ya que, habitualmente, las técnicas de investigación 
animal no dependen de las capacidades lingúísticas (por ejemplo, Cohen, 1976; 
Rovee-Collier, 1983). 

Por último, el estudio de la cognición animal es importante para la compren- 
sión de la conducta animal. La información que vamos a describir nos propor- 
ciona una gran comprensión de la conducta. Sin esta información, estaríamos 
perdidos para explicar muchas de las cosas que hacen los animales. 
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LOS MECANISMOS DE LA MEMORIA EN LA CONDUCTA ANIMAL 


La memoria es uno de los procesos cognitivos más extensamente investigados, 
Gran parte de la investigación y de la teorización sobre la memoria se ha centrado 
en la actuación de los sujetos humanos. Sin embargo, los investigadores de la 
conducta animal también se han interesado mucho por el estudio de los mecanis- 
mos de la memoria durante los últimos 15 años (por ejemplo, Hon:g y James, 
1971; McGaugh y Herz, 1972; Medin, Roberts y Davis, 1976; Spear, 1978; Spear y 
Miller, 1981). En el presente capitulo vamos a describir algunas de las técnicas 
principales que se utilizan en el estudio de la memoria animal y se discutirán 
también unos pocos problemas teóricos importantes de este campo. 

El término memoria se utiliza, normalmente, para referirse a la capacidad de 
reproducir o volver a dar uma información que se experimentó en un tiempo 
anterior. Decimos que recordamos lo que ocurrió en nuestra infancia si podemos 
contar historias de nuestras experiencias de la infancia. Decimos que recordamos 
un número de teléfono si podemos retenerlo bien, y decimos que recordamos el 
nombre de alguien si llamamos a esa persona correctamente por su nombre. Des- 
graciadamente, no pueden llevarse a la práctica normalmente pruebas similares 
con los animales. No podemos pedir a un animal que nos diga qué hizo la semana 
pasada. Á cambio, tenemos que usar las respuestas patentes del animal como 
clave para su memoria. Si muestro gato se marcha lejos de casa y encuentra el 
camino de vuelta, podríamos concluir que recordaba dónde vivíamos. Si nuestro 
perro se encariña con una persona determinada y la saluda con ilusión después de 
una larga separación, podríamos concluir que recordaba a esa persona. Estos casos 
y otros similares ilustran que la extstencia de la memoria en los animales se 
identifica por el hecho de que su conducta actual puede predecirse a partir de 
algán aspecto de sus experiencias anteriores. En el momento en que la conducta 
del animal está determinada por hechos pasados, podemos concluir que en el 
control de esa conducta interviene algún mecanismo de la memoria. 

Como puede observarse, muestra definición de memoria es muy similar al 
modo en que definíamos el aprendizaje. En el capítulo 1 caracterizábamos al 
aprendizaje como un cambio duradero en el mecanismo de la conducta como 
resultado de una exposición previa a acontecimientos ambientales. La diferencia 
principal entre las definiciones de memoria y aprendizaje consiste en que el 
aprendizaje se refiere a los efectos duraderos de la experiencia previa. Por el 
contrario, en los mecanismos de la memoria no se excluyen los casos en los que el 
control de la conducta por las experiencias pasadas es de corta duración. Las cosas 
se pueden recordar durante períodos largos o cortos. Podemos decir que algo se 
recuerda aun cuando la memoria dura sólo un poco de tiempo. En todos los casos 
de aprendizaje interviene la memoria. Si el sujeto es incapaz de recordar hechos 
pasados, las experiencias pasadas no pueden producir un cambio duradero en su 
conducta. Sin embargo, no todos los ejemplos de memoria implican aprendizaje. 
Las experiencias que se recuerdan por un tiempo y que influyen en las acciones 
del animal implican memoria pero no aprendizaje. 

Dado que los conceptos de aprendizaje y de memoria son tan semejantes, el 
concepto de memoria es superfluo en la interpretación de muchos experimentos 
de aprendizaje. Considérese, por ejemplo, el condicionamiento salivar al tono. Al 
emparejar de forma repetida el tono con la comida, el perro llega a salivar como 
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compartimento correcto durante el intervalo de demora. En los mapaches no se 
observaron tales orientaciones posturales. Ya que los mapaches no mantenían 
una orientación postural durante el intervalo de demora, su conducta requería 
algún tipo de mecanismo de memoria neurológica. 

Con el procedimiento de demora, los animales tenian que recordar qué com- 
partimento se habia iluminado al comienzo de ese ensayo. Sin embargo, una vez 
que terminaba el ensayo, esa información dejaba de ser útil porque la comida era 
probable que se encontrara en otro compartimento en el ensayo siguiente. Así 
pues, la memoria del compartimento preciso que se había iluminado era necesaria 
solamente para completar el trabajo de un ensayo determinado. Este tipo de 
memoria se llama memoria de trabajo. 

La memoria de trabajo es operativa cuando se tiene que retener la informa- 
ción sólo el tiempo suficiente para completar una tarea concreta, después de la 
cual más vale desechar la información porque ya no se necesita o (como en el 
experimento de Hunter) porque puede interferir para lograr completar de forma 
satisfactoria la tarea siguiente. Si tenemos, por ejemplo, que ir a varias tiendas en 
una zona comercial, es útil recordar qué tiendas hemos visitado ya con el fin de 
seleccionar cuál es la siguiente que vamos a visitar. Sin embargo, esta información 
es útil sólo durante esa incursión concreta por las tiendas. Un mecánico que cam- 
bia el aceite de un coche y lo engrasa tiene que recordar qué pasos del trabajo ha 
completado ya, pero sólo mientras trabaja en ese coche concreto. Al cocinar un 
buen estofado, tenemos que recordar qué especias hemos echado antes de aña- 
dir otras, pero una vez que el estofado está cocinado, podemos olvidarnos de 
esa información. Todos estos ejemplos son ilustrativos de la memoria de 
trabajo. 

La memoria de trabajo suele ser de corta duración. En el expertmento de 
Hunter, la memoria sólo duraba 10 segundos en las ratas y 25 minutos en los 
mapaches. Sin embargo, como veremos, en situaciones especiales la memoria de 
trabajo puede durar varias horas o varios días. 

Los ejemplos de memoria de trabajo ilustran la retención, con una duración 
limitada, de una información adquirida recientemente. Sin embargo, a menudo 
esa información es sólo útil en el contexto de un conocimiento más duradero. En 
el experimento de Hunter, por ejemplo, recordar qué compartimento se había 
iluminado al comienzo del ensayo no era suficiente para obtener la comida. Esta 
información sólo era útil en el contexto del conocimiento duradero de que la luz 
marcaba el compartimento con la comida. En contraposición con la información 
proporcionada por la memoria de trabajo, que se desechaba después de cada 
ensayo, la información sobre la relación entre la fuz y la comida se tenía que 
recordar en todos los ensayos. Esa memoria se llama memoria de referencia 
(Hontg, 1978). 

La memoria de referencia es una retención a largo plazo de la información 
necesaria para lograr un uso satisfactorio de la nueva y reciente información 
adquirida. Para comprar de una manera eficaz en la zona comercial tenemos que 
recordar mo sólo en qué tiendas hemos estado ya, sino también, la información 

general sobre el centro comercial. Igualmente, la información acerca de lo que un 
mecánico acaba de realizar no tiene utilidad, a menos que la persona sepa de 
forma general cómo engrasar un coche y cómo cambiarle el aceite, y el conoci- 
miento de qué especias hemos añadido ya 2 un estofado es útil sólo si ya sabemos 
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qué especias utilizar y qué cantidad de ellas. Toda utilización satisfactoria de la 
memoria de trabajo requiere una memoria de referencia aproplada. 


Investigaciones sobre la memoria de trabajo 


Desde las investigaciones de Hunter se han desarrollado técnicas cada vez más 
sofisticadas para el estudio de la memoria de trabajo. Vamos a estudiar tres SItua- 
ciones que han suministrado importante información sobre la memoria de tra- 
bajo. Una de ellas, el procedimiento de ajuste demorado a la muestra, es un pro- 
cedimiento de laboratorio que se desarrolló sin tener muy en cuenta las predis- 
posiciones comportamentales innatas de los animales y puede adaptarse al estudio 
del modo en que los animales recuerdan cualquier estímulo dentro de una varie- 
dad de ellos. Las otras técnicas parecen estar estrechamente relacionadas con 
estrategias de abastecimiento especificas de la especte e ilustran algunas especiali- 
zaciones adaptativas notables sobre la memoria de trabajo para estímulos espa- 


ciales. 


Ajuste demorado a la muestra. El procedimiento de ajuste demorado a la 
muestra, una de las técnicas más versátiles para el estudio de la memoria de 
trabajo, supone un refinamiento sustancial de la técnica que utilizó Hunter origi- 
nariamente. Como en el procedimiento de Hunter, el sujeto se expone a una clave 
que indica cuál es la respuesta correcta en un ensayo concreto. A continuación este 
estímulo se retira, antes de permitir al animal que realice la conducta diseñada. 
En el experimento típico con palomas, por ejemplo, la cámara experimental con- 
tiene tres teclas de respuesta colocadas en línea, como en la figura 11.1. El estudio 
consiste en ver si las palomas pueden recordar un estímulo de muestra el tiempo 
suficiente para picotearlo cuando se les ofrece después la elección entre la muestra 
y algún otro estímulo. La tecla central se utiliza para presentar el estímulo de 
muestra, y las dos teclas laterales se utilizan después para presentar las claves a 
elegir. Los estímulos de la prueba podrían consistir en una serie de líneas hori- 


Figura 11.1. —Diagrama del pro- 
cedimiento de ajuste demorado a 
la muestra con palomas. La cá- 
mara experimental tiene tres te- 
clas de respuesta dispuestas en 
fila. Al comienzo de un ensayo 
la tecla del medio se ilumina con 
una luz blanca (fila A). Después 
de que la paloma picotee la tecla 
central blanca, el estímulo parrón 
(horizontal) se proyecta sobre 
ella (fila B). Entonces se retira 
este estímulo, y después de un 
tiempo se presentan en las te- 
clas laterales dos estímulos a ele- 
gir (horizontal y vertical) (fila C). 
Sólo son reforzados los picota- 
zos en el estímulo que se ajusta 
al patrón. 
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zontales y verticales proyectadas desde atrás sobre las teclas de respuesta. Al 
comienzo del ensayo, la tecla central se ilumina con una luz blanca (véase línea A 
de la figura 11.1). Después de que la paloma picotea la tecla central blanca, uno de 
los estímulos de la prueba (el de líneas horizontales, por ejemplo) se proyecta 
sobre ella (línea B de la figura 11.1), y constituirá la muestra para este ensayo. 
Normalmente se necesitan varios picotazos en el estímulo de muestra, después de 
lo cual se apaga la muestra y se encienden las dos teclas laterales. Una de las 
teclas laterales se ilumina con la muestra de ese ensayo (la horizontal), y la otra 
se ilumina con el patrón alternativo (vertical) (línea C de la figura 11.1). Si la 
paloma picotea en el patrón que es igual que la muestra (en este caso horizontal), 
se le refuerza. Si la paloma picotea en otro patrón no se le suministra ningún 
reforzamiento. Así, la respuesta reforzada es la que «se ajusta» a la muestra. Los 
estímulos que hacen de muestra se determinan al azar, y varían de un ensayo al 
siguiente, y el estímulo que es igual a la muestra tiene la misma probabilidad de 
presentarse a la izquierda que a la derecha durante la elección. Por tanto, la 
paloma nunca puede predecir qué estímulo va a ser la muestra en un ensayo 
determinado o dónde aparecerá el estímulo al que debe ajustarse durante la 
elección. 

En los estadios iniciales del entrenamiento de ajuste a la muestra, el estímulo 
de muestra permanece visible hasta que el sujeto ha realizado la elección correcta. 
Así, en nuestro ejemplo, el patrón horizontal en la tecla central se quedaría ¡lu- 
minado hasta que el sujeto picoteara correctamente la tecla lateral horizontal. A 
ese procedimiento se le llama ajuste simultáneo a la muestra y no se precisan 
procesos de memoria, porque cuando se ejecuta la respuesta está visible la tecla 
que indica la respuesta correcta. Una vez que el sujeto domina el procedimiento 
de ajuste simultáneo a la muestra, el estímulo de muestra puede presentarse sólo 
brevemente, y puede ser retirado antes de que se suministren los estímulos a 
elegir. La introducción de una demora entre la exposición al estímulo de muestra 
y la disponibilidad de las claves de elección convierte el procedimiento en ajuste 
demorado a la muestra. 

En la mayoría de las aplicaciones, como ya dijimos anteriormente, el estímulo 
al que hay que ajustarse tiene la misma probabilidad de aparecer en la tecla de 
elección de la derecha que en la de la izquierda. Por tanto, los sujetos no pueden 
hacer la elección correcta orientándose a la derecha o a la izquierda cuando la 
muestra aparece en la tecla central y manteniendo esa postura con el cuerpo hasta 
que se presentan los estímulos a elegir. Así, frente al procedimiento de Hunter, 
las orientaciones posturales simples no pueden utilizarse para aumentar la proba- 
bilidad de la respuesta correcta. Los sujetos se ven forzados a utilizar procesos de 
memoria más sofisticados para obtener reforzamiento en el procedimiento de 
ajuste demorado. 


Determinantes procedimentales del ajuste demorado a la muestra. El proce- 
dimiento de ajuste demorado a la muestra se ha utilizado extensamente en las 
investigaciones sobre numerosas especies, entre las que se incluyen los monos, las 
palomas, los delfines, los peces de colores y las ratas (Blough, 1959; D'Amato, 
1973; Herman y Thompson, 1982; Jarrard y Moise, 1971; Roberts y Grant, 1976; 
Steinert, Fallon y Wallace, 1976; Wallace, Steinert, Scobie y Spear, 1980), y el 
procedimiento ha sido adaptado para investigar cómo recuerdan los animales una 
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variedad de estímulos, tales como formas visuales, número de respuestas realiza- 
das, presencia o ausencia de reforzamiento, y la localización espacial de los estí- 
mulos (por ejemplo, D'Amato, 1973; Maki, Moe y Bierley, 1977; Wilkie y Sum- 
mers, 1982). Existen tres aspectos esenciales del procedimiento de empareja- 
miento con la muestra que determinan la exactitud de la ejecución. Uno de ellos 
es la naturaleza del estímulo que se tiene que recordar. Por ejemplo, en un estudio 
reciente, Wilkie y Summers (1982) probaron la capacidad de las palomas para 
recordar la posición espacial de unas luces iluminadas. Nueve luces se dispusieron 
en tres columnas y tres filas. En cada ensayo se iluminaban tres de las luces. La 
posición de las luces iluminadas era mucho mejor memorizada si las luces se 
encontraban en línea recta que cuando formaban un patrón discontinuo. (Más 
adelante, en el capítulo 12, vamos a discutir la importancia de los patrones de 
estimulación.) 

Otros dos factores importantes para determinar la exactitud del ajuste demo- 
rado a la muestra son el intervalo de demora y la duración de la exposición al 
estímulo de muestra al principio del ensayo. Por ejemplo, en un experimento, 
Grant (1976) realizó pruebas con palomas en un aparato estándar de tres teclas 
después de que recibieran un entrenamiento extenso de ajuste demorado a la 
muestra con estímulos visuales. Dos parejas de colores —rojo-verde y azul-ama- 
rillo— hicieron de muestra y de estímulos comparativos en ensayos alternativos. 
Al comienzo de cada ensayo, la tecla central se iluminaba con una luz blanca. 
Cuando el sujeto picoteaba la tecla central, el color que servía de muestra en ese 
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Figura 11.2.—Porcentaje de respuestas correctas en un proceso de ajuste demorado a la muestra, en 
función de la duración de la presentación del estimulo patrón (1-14 segundos) y de la demora entre el 
parrón y los estímulos de elección (0-60 segundos). (Según Grant, 1976.) 
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ensayo se presentaba en la tecla central durante 1, 4, 8 o 14 segundos. Esto iba 
seguido de un intervalo de demora de 0, 20, 40 o 60 segundos, después del cual las 
dos teclas laterales se iluminaban, una con el color ajustado a la muestra y la otra 
con el color que completaba la pareja. Después de que el sujeto hacía la elección, 
todas las teclas se apagaban durante un intervalo entre los ensayos de 2 minutos. 

En la figura 11.2 se resumen los resultados del experimento, Si los sujetos 
picotearan al azar las teclas de elección, acertarían el 50 por 100 de las veces. 
Puntuaciones más altas indican que los sujetos respondían al estímulo de la mues- 
tra basándose en su memoria. Para los distintos tiempos de presentación de la 
muestra utilizados, la exactitud del ajuste descendía conforme aumentaban los' 
intervalos de demora que se introducían entre la exposición a la muestra y la 
oportunidad de dar una respuesta de elección. De hecho, si la muestra se presen- 
taba sólo 1 segundo y la oportunidad de hacer una elección se retrasaba 40 segun- 
dos o más, las palomas respondían de forma aleatoria, El rendimiento mejoraba si 
se exponian a la muestra durante períodos largos. Cuando la muestra se presen- 
taba durante 4, 8 o 14 segundos, los sujetos lograban rendimientos superiores al 
azar, aun cuando el intervalo de demora durara hasta 60 segundos. Ási pues, la 
exactitud del procedimiento de ajuste demorado a la muestra descendía en función 
del intervalo de demora y aumentaba en función de la duración de la exposición al 
estimulo de la muestra. 


Estrategias de respuesta en el ajuste a la muestra. El procedimiento de ajuste 
a la muestra es análogo al problema de discriminación en el que, para ser refor- 
zado, el sujeto tiene que responder al estímulo correcto y no responder al estí- 
mulo que no es correcto. Como ya advertimos en la discusión sobre el aprendizaje 
en el capítulo 8 (en el apartado «¿Qué se aprende en el entrenamiento de discrimi- 
nación?»), esa tarea con dos alternativas puede resolverse simplemente respon- 
diendo a la elección correcta, simplemente imhibiendo la conducta de elección 
incorrecta, o utilizando ambas estrategias de respuesta. El aprendizaje discrimina- 
tivo (que se puede considerar que incluye el establecimiento de una memoria de 
referencia) parece que implica una estraregia de respuesta combinada. Por el con- 
trario, parece que en el ajuste a la muestra los sujetos se centran sólo en la 
elección correcta. En un interesante experimento con palomas que apoya esta 
conclusión, se utilizó un aparato de tres teclas construido especialmente de forma 
que el estímulo proyectado sobre la tecla de respuesta era sólo visible si la paloma 
se situaba directamente delante de la tecla (Wright y Sands, 1981). Este aparato 
permitía a los experimentadores determinar a qué tecla de respuesta miraban las 
palomas antes de hacer sus respuestas de elección en un procedimiento de ajuste a 
la muestra. Los resultados mostraron que las aves se centraban en la alternativa 
correcta. Si veían el estímulo al que ajustarse, picoteaban en él sin molestarse en 
comprobar qué estimulo aparecía en la tecla del otro lado (véase también Zentall, 
Edwards, Moore y Hogan, 1981). 


El aprendizaje de regla específica frente al de regla general. Las pruebas 
revisadas arriba indican que los animales se centran en la elección correcta en los 
procedimientos de ajuste a la muestra, ¿Qué les lleva a identificar un estímulo 
como correcto? Una posibilidad es que aprendan una regla general que implique 
una comparación entre la muestra y los estímulos de elección. La regla puede ser, 
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por ejemplo, «escoger lo mismo que la muestra». Otra posibilidad sería que los 
animales aprendan una serie de reglas específicas o de relaciones estímulo- 
respuesta. Por ejemplo, en el experimento de Grant (1976) descrito arriba se 
utilizaron parejas de colores rojo-verde y azul-amarillo. Las palomas pueden 
haber aprendido una serie de relaciones especificas estímulo-respuesta: «picotea 
el rojo después de la exposición al rojo», «picotea el verde después de la exposi- 

ción al verde», y así sucesivamente. La mayoría de los procedimientos de ajuste a 

la muestra pueden resolverse aprendiendo una regla general de «lo mismo que» o 

aprendiendo una serie de relaciones específicas estímulo-respuesta, y no existe un 

acuerdo claro sobre cuál de esos tipos de aprendizaje predomina (por ejemplo 
Roitblat, 1984; Zentall, Hogan y Edwards, 1984). 
Se han aportado pruebas que apoyan una u otra alternativa mediante estudios 
de transterencia del entrenamiento. Cierto tipo de experimento de transferencia 
consiste en llevar a cabo, en primer lugar, un entrenamiento de ajuste a la mues- 
tra con un conjunto de estímulos, y después llevar a cabo el mismo tipo de entre- 
namiento con un nuevo conjunto de estímulos. La hipótesis del aprendizaje espe- 
cífico estímulo-res puesta predice poca transferencia positiva (o negativa) a los ' 
nuevos estímulos de la conducta de ajuste a la muestra porque la nueva tarea 
requiere aprender un nuevo conjunto de relaciones estiímulo-respuesta. Por el 
contrario, la hipótesis del aprendizaje de la regla general predice una transferen- 
Cia positiva considerable pues la segunda tarea de ajuste a la muestra implica la 
misma regla general «lo mismo que» que la primera tarea. Resumiendo, en la 
transferencia del entrenamiento de un problema de ajuste a la muestra a otro la 
hipótesis del aprendizaje de la regla general predice un rendimiento mejor de la 
transferencia que la hipótesis del aprendizaje de la regla específica. 

Mediante estudios de transferencia se han obtenido pruebas que confirman la 
hipótesis del aprendizaje de la regla general (véase Zentall y cols, 1984). Sin 
embargo, se ha aducido que no ha sido Muy grande la magnitud de estos efectos 
(véase Roitblat, 1984). La mayoría de las pruebas sugieren que puede darse tanto 
el aprendizaje de regla general como el aprendizaje de estímulo-respuesta (por 
ejemplo, Farthing y Opuda, 1974; Wilkie, 1983). Es probable que el tipo de 
aprendizaje que se produce esté relacionado con el tamaño del conjunto de estí- 
mulos usado en el procedimiento de ajuste a la muestra. Un estudio como el de 
Grant (1976), que utilizó los mismos cuatro colores una y Otra vez en ensayos 
sucesivos, puede favorecer el aprendizaje de relaciones específicas estímulo. 
respuesta, Por el contrario, los procedimientos que emplean una amplia gama de 
estímulos pueden favorecer el aprendizaje de una regla más general. Un caso 
extremo de este tipo de procedimientos es el procedimiento de ensayos únicos, en 
el que se utiliza como muestra un estímulo diferente en cada ensayo (por ejem lo 
Overman, McLain, Ormsby y Brooks, 1983). a 


El proceso de memoria activo frente al pasivo. Otro problema importante 
en el análisis de la conducta de ajuste demorado a la muestra lo constituye deter- 
minar el tipo de memoria implicado. Resultados como los que se muestran en la 
y Bura 11.2 han fomentado una interpretación de desvanecimiento de la huella de 
a memoria a corto plazo (Roberts y Grant, 1976). Esta hipótesis sostiene que la 
presentación de un estímulo produce cambios en el sistema nervioso que descien- 
den gradualmente, o se desvanecen, después de que se retira el estímulo. Se 
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supone que la fuerza inicial de la huella que deja el estímulo refleja la energía 
física del estímulo. Así pues, presumiblemente los estímulos más largos O más 
intensos dan Jugar a huellas de estímulo más intensas. Sin embargo, con indepen- 
dencia de la fuerza inicial de la huella, se supone que ésta decae a un ritmo igual 
después que cesa el estímulo. Hasta qué punto la memoria de un hecho ejerce un 
control sobre las acciones del organismo depende de la intensidad de la huella de! 
estímulo en ese momento. Cuanto más intensa sea la huella, más fuerte es el 
efecto del estímulo pasado sobre la conducta del sujeto. El modelo de desvaneci- 
miento de la huella predice resultados exactamente iguales que los que se resu- 
men en la figura 11.2. Un aumento en el intervalo de demora en un procedi- 
miento de ajuste a la muestra reduce la exactitud de la ejecución posiblemente 
porque la huella del estímulo de la muestra se debilita después de intervalos más 
largos. Por el contrario, al aumentar la duración de la exposición a la muestra 
mejora la ejecución posiblemente porque las exposiciones más largas a la muestra 
producen huellas de estímulo más intensas. 

La hipótesis del desvanecimiento de la huella destaca las características físicas 
del estímulo de muestra y es un mecanismo pasivo de la memoria, Se supone que 
después de cesar el estímulo, el desvanecimiento de su huella comienza automáti- 
camente para avanzar con independencia de futuras experiencias. Se supone que, 
a medida que la huella decae, la información sobre el estímulo se pierde definiti- 
vamente. Frente a la hipótesis del desvanecimiento de la huella, distintos resulta- 
dos sugieren que la memoria de trabajo no depende enteramente de las caracterís- 
ticas físicas del hecho a recordar, sino que implica procesos activos. Por ejemplo, 
la ejecución del ajuste demorado a la muestra mejora mediante la práctica con los 
mismos tipos de estímulos. La historia del aprendizaje de un mono llamado Ros- 
coe nos ofrece un ejemplo espectacular. Después de 4.500 ensayos de entrena- 
miento, Roscoe no podía rendir por encima del nivel aleatorio si se introducía un 
intervalo de 20 segundos entre la muestra y los estímulos de elección. Sin 
embargo, después de 17.500 ensayos, ajustado correctamente el estímulo de la 
muestra, casi el 80 por 100 de las veces con un intervalo de demora entre la 
muestra y la elección de 2 minutos, y después de aproximadamente 30.000 ensa- 
yos, su actuación, con un intervalo de demora de 9 minutos, fue superior a la 
aleatoria (D'Amato, 1973). Otro determinante importante de la memoria de tra- 
bajo es hasta qué punto resulta sorprendente el estímulo. Varias líneas de investi- 
gación han mostrado que los hechos sorprendentes se recuerdan mejor que los 
hechos esperados (Maki, 1979; Terry y Wagner, 1975). Los estudios que a conti- 
nuación vamos a discutir apoyan también la existencia de procesos de memoria 
activa en la memoria de trabajo, y muestran que los procesos de la memoria 
pueden quedar sometidos al control por estímulos externos. 


La memoria espacial en un laberinto radial. El procedimiento de ajuste a la 
muestra puede adaptarse para investigar cómo recuerdan los animales una gran 
variedad de estímulos. La técnica que vamos a estudiar a continuación tiene una 
posibilidad de aplicación más limitada, pero se centra en un tipo de memoria muy 
importante: la memoria de lugares. Los animales, para ser capaces de desplazarse 
de forma eficaz por su hábitat matural, tienen que recordar de qué forma está 
distribuido su ambiente, dónde están localizados los espacios abiertos, las zonas de 
abrigo y las fuentes potenciales de comida. En muchos ambientes, una vez que se 
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Figura 11.3.—Vista superior de 
un laberinto radial de ocho bra- 
zos usado para el estudio de la 
memoria espacial. Los números 
indican dimensiones en centíme- 
tros. (Según Olton y Samuelson, : 

1976.) 
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ha tomado comida en un lugar, no vuelve a ser disponible hasta que, pasado un 
tiempo, vuelve a estar lleno. Por tanto, para su abastecimiento, los animales tie- 
nen que recordar dónde hallaron comida la última vez y evitar este lugar durante 
un tiempo. Esta conducta de abastecimiento está bien documentada en las espe- 
cies de honeycreeper hawaianas, los amakihi (Loxops virens). Estas aves se ali- 
mentan del néctar de las flores marmmmane. Después de alimentarse de un grupo 
de flores evitan volver a las mismas flores durante una hora aproximadamente. 
Al retrasar la vuelta al grupo de flores que acaban de visitar, las aves aumentan la 
probabilidad de encontrar néctar en las flores en las que buscan. Parece ser que 
recuerdan la localización espacial del grupo de flores que acaban de visitar. 

La memoria para la localización en el espacio —la memoria espacial — se ha 
estudiado en el laboratorio utilizando laberintos complejos (por ejemplo, Olton, 
1979). En una investigación se realizaron pruebas con ratas en un laberinto simi!- 
lar al que se muestra en la figura 11.3. (Olton y Samuelson, 1976). El laberinto 
tenía ocho brazos que radiaban desde un área de elección central. Se colocaba una 
bolita de comida en el extremo de cada brazo. En cada prueba, la rata era colocada 
en el centro del laberinto y era libre de entrar en cualquier brazo para obtener allí 
la comida. Una vez consumida la bolita de comida, ese brazo del laberinto se 
quedaba sin comida durante el resto del ensayo. ¿Como debería la rata intentar 
encontrar la comida en esa situación? Una posibilidad es seleccionar al azar el 
corredor en el que se va a entrar cada vez. De esta forma la rata podría entrar en 
un corredor, comer allí la comida, volver al área central y después seleccionar al . 
azar otro brazo del laberinto para entrar a continuación, y así sucesivamente. Sin 
embargo, esto podría suponer recorrer corredores en los que la rata ya había 
obtenido comida. Una estrategia más eficaz sería entrar solamente en aquellos 
brazos del laberinto que el animal no hubiera visitado ya en ese ensayo. Esto es, 
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de hecho, lo que la mayoría de los animales aprendían a hacer. Entrar en un brazo 
que no se había visitado anteriormente (y que por tanto contenía comida) se 
consideraba una elección correcta. La figura 11.4 resume el número de elecciones 
correctas que realizaban los sujetos durante las primeras ocho elecciones en prue- 
bas sucesivas. Después de familiarizarse con el laberinto, las ratas realizaban una 
media de casi siete elecciones correctas por prueba durante el desarrollo de las 
primeras cinco pruebas. Con la práctica continua, el número medio de elecciones 
correctas se estabilizaba por encima de siete, lo que indica que los sujetos rara vez 
entraban en un brazo que ya hubieran elegido previamente en ese ensayo. 

La figura 11.4 ilustra que las ratas no necesitan mucho entrenamiento para 
actuar de modo eficaz en el laberinto radial. La tarea del laberinto radial parece 
que aprovecha la tendencia inmata de las ratas y otras especies para evitar los 
espacios recientemente visitados (por ejemplo, Haig, Rawlins, Olton, Mead y 
Taylor, 1983). Esta puede estar relacionada con las estrategias de abastecimiento 
de las especies o con su conducta exploratoria (Cole, Hainsworth, Kamil, Mercier 
y Wolf, 1982; Gaffan y Davies, 1981). 


Los mecanismos que rigen la actuación en el laberinto radíal. El hecho de 
que las ratas del estudio de Olton y Samuelson casi siempre escojan un brazo del 
que aún no se ha quitado la comida contribuye al acopio eficaz de comida. Sin 
embargo, esta información no es suficiente para demostrar que los animales usa- 
ran algúa tipo de mecanismo de memoria espacial. Existen varias formas por las 
que podían haber entrado en los brazos aún no escogidos sin recordar, necesaria- 
mente, la localización de todos los brazos que ya habían visitado. Por ejemplo, las 
ratas podrían haber sido capaces de oler la comida a la entrada de los corredores 


Figura 11.4. ——Número medio de 
respuestas correctas que hicieron 
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no visitados. Otra posibilidad es que las ratas marcaran cada brazo visitado con 


algo como una gota de orina y después evitaran simplemente los brazos del labe-* 
FInto que tuvieran esta marca del olor. Otra posibilidad es que los animales hubie-- 


ran aprendido una cadena de respuestas de forma que siempre seleccionaban los 
brazos en una secuencia fija. Por ejemplo, podrían haber aprendido a entrar en 
brazos sucesivos siguiendo el sentido de las agujas del reloj. 

Se han realizado numerosos experimentos para determinar si la actuación de 
las ratas en un laberinto radial está gobernada por la memoria espacial o por 
algún otro mecanismo. Por lo general, estos estudios han apoyado la interprera- 
ción de la memoria. En uno de esos estudios se realizaron pruebas con ratas para 
ver si usaban el olor de la comida como clave para entrar en un corredor. Se les 
permitió a las ratas coger la comida de seis de los ocho brazos de la forma habi- 
tual. Ántes de dejar que los sujetos hicieran las elecciones restantes, se volvió a 
poner comida en esos brazos. Si las ratas estuvieran usando el olor de la comida 
como clave para entrar en un pasillo, sería de esperar que la reposición de la 
comida les llevara a volver a entrar en los brazos ya elegidos. Sin embargo, no 
ocurrió esto, En las dos elecciones siguientes, los sujetos no volvieron a los brazos 
elegidos previamente, aun cuando se había puesto comida de nuevo en ellos ya 
continuación no era mayor la probabilidad. de que entraran en los brazos que 
AT sido aprovisionados que en los que no tenían comida (Olton y Samuelson, 

En otro estudio se mojó el laberinto con loción para después del afeitado para 
enmascarar el rastro de olor que las ratas pudieran haber dejado cuando pasearon 
por el laberinto (Olton y Samuelson, 1976). En un estudio relacionado con éste, se 
| alteró quirúrgicamente el sentido del olor de los animales (Zoladek y Roberts 

1978). Ninguna de esas manipulaciones disminuyó el rendimiento del animal. En 
otro tipo de procedimiento se permitía a los animales entrar en algunos brazos 
durante una sesión de prueba. Se les encerró después en el centro del laberinto 
antes de permitírseles entrar en los brazos restantes. Durante el período de con- 
finamiento, se intercambiaron algunos de los brazos del laberinto, o bien se giró 
todo el laberinto 45%. Se quitaron los tabiques que bloqueaban las entradas a los 
corredores, y los animales eran libres de hacer elecciones adicionales. El punto de 
interés consistía en saber si las ratas volverían a entrar en los brazos elegidos 
previamente al estar en una nueva posición, o si evitarían los brazos elegidos 
anteriormente, independientemente de dónde se encontraran éstos. Los resulta- 
dos indicaban que las ratas respondían en base a una localización espacial antes 
que en base al olor u otras características de los brazos del laberinto (Olton 
Collison y Werz, 1977; Olton y Samuelson, 1976). Una vez que los sujetos se 
habían llevado la comida de un corredor situado en un lugar determinado, evita- 
ban volver a entrar en ese lugar aun cuando se colocara allí un nuevo brazo del 
laberinto. Sin embargo, no evitaban visitar los antiguos brazos del laberinto que 
estaban ahora en un lugar nuevo. 

Las pruebas de las que disponemos indican también que las ratas, en un expe- 
rimento de laberinto radial, pueden actuar de forma eficaz sin usar cadenas de 
respuestas ní entrar en los brazos del laberinto en un orden fijo de un ensayo al 
siguiente. Siempre que la zona central de elección sea lo suficientemente pequeña 
para que las. ratas puedan alcanzar fácilmente todos los brazos desde cualquier 
parte de la zona céntral, no eligen los brazos en un orden fijo (Olton y Samuel- 
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son, 1976; véase también Olton y otros, 1977). Si la zona central se agranda, es 
más probable que las ratas seleccionen los brazos del laberinto más cercanos y 
vayan entrando en los brazos adyacentes durante las sucesivas elecciones (Yoerg y 
Kamil, 1982). Esta estrategia de respuesta sirve para minimizar el tiempo del 
recorrido para obtener cada bolita de comida, y es tal como predice la teoría del 
abastecimiento Óptimo. 

Los estudios revisados arriba han sido importantes para excluir varias posibles 
claves de la actuación en un laberinto radial, y sugieren que los estímulos espacia- 
les son esenciales. ¿Qué son las claves espaciales y cómo se identifican? Las claves 
espaciales son estímulos que señalan la localización de un objeto en el medio. Las 
ratas parece que utilizan elementos como una ventana, una puerta, una esquina de 
la habitación o un cartel en la pared como marcadores del ambiente experimental 
y localizan los brazos del laberinto de acuerdo con esos marcadores. El movi- 
miento de esos marcadores del laberinto hace que las ratas traten los brazos como 
si éstos estuvieran en muevas posiciones (Suzuki, Augerinos y Black, 1980). Así 
pues, la localización espacial se determina de acuerdo con claves distales del lugar, 
no con estímulos locales del interior del laberinto (véase también Morris, 1981). 
Parece ser que las claves distales del ambiente se perciben visualmente (Mazma- 


nian y Roberts, 1983). 


Mapa espacial frente a memoria sersal de una lista. ¿De qué forma recuer- 
dan los animales la información acerca de los lugares en los que han estado 
recientemente? Una posibilidad es que los animales recuerden una lista seriada de 
lugares recientemente visitados. Sin embargo, esto parece improbable, dada la 
notable capacidad de memoria espacial. Por ejemplo, se ha observado que las 
ratas y los jerbos actúan correctamente en un laberinto radial com 17 brazos 
(Olton y otros, 1977; Wilkie y Slobin, 1983), y esto no representa, probable- 
mente, el límite de su memoria espacial (Roberts, 1979). (Los seres humanos sólo 
son capaces de retener una lista de unos siete elementos para la memoria de 
trabajo.) Una alternativa más probable es que los animales formen un mapa 
espacial que tenga marcados los lugares previamente visitados (Roberts, 1984). 
Una implicación interesante de esta hipótesis es que, una vez que los animales 
han aprendido la localización de algo, son capaces de llegar desde posiciones de 
salida que no han utilizado previamente. 

Morris (1981) probó la hipótesis del mapa espacial con un procedimiento que 
requiere que las ratas hallen la posición de una plataforma ligeramente sumergida 
en un depósito de agua. El agua del depósito se hacía opaca añadiéndole leche de 
forma que las ratas no pudieran ver dónde estaba situada la plataforma. Durante 
el entrenamiento se introducía siempre a los animales en el agua por el mismo 
lugar cerca del borde del estanque, y rápidamente aprendían a nadar directamente 
desde allí hasta la plataforma. El aspecto interesante del estudio acontecía durante 
las últimas pruebas, en las que se les ponía en posiciones nuevas de salida en el 
borde del estanque. St hubieran aprendido respuestas específicas para Jlegar a la 
plataforma, no hubieran sido capaces de nadar hasta la plataforma a partir de 
lugares nuevos. Sin embargo, los resultados mostraban un rendimiento notable- 
mente bueno (véase figura 11.5). Este hallazgo sugiere que las ratas habían for- 
mado un mapa espacial del estanque, con la posición de la plataforma sumergida 
marcada en su mapa mental. 
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Figura 11.5, —Vistas superiores de una piscina circular con una plataforma (pequeño círculo) sumer- 

gida (y por tanto, invisible) sivuada en el cuadrante noreste en los cuatro ensayos. Al comienzo de cada 

ensayo se colocaba a una misma rata en va punto diferente del perímetro de la piscina. Las líneas 

desde el perímetro hasra la plataforma muestran el camino seguido por la rata para llegar a la plara- 
forma en cada ensayo. (Según Morris, 1981.) 


Duración y especifidad del contexto de la memoria de trabajo espacial. 
Además del amplio número de lugares que los animales recuerdan a la vez, también 
son notables la duración y la especificidad del contexto en la memoria de trabajo 
espacial. 

En una prueba importante sobre los límites de la memoria espacial, Beatry y 
Shavalia (1980b) permitieron que las ratas hicieran cuatro elecciones en un labe- 
rinto radtal de ocho brazos de la manera habitual. A continuación, los sujetos eran 
retenidos en sus jaulas por períodos de tiempo de hasta 24 horas. Después del 
intervalo de demora, se les devolvía al laberinto y se les permitía hacer de 5 a 8 
elecciones. La entrada dentro de un corredor que no hubieran escogido anterior- 
mente se consideraba una respuesta correcta, la entrada en un corredor utilizado 
previamente se consideraba un error. La figura 11.6 muestra el porcentaje de 
elecciones correctas en función del intervalo de demora. Un intervalo de hasta 4 
horas después de las primeras cuatro elecciones no alteraba el rendimiento. Los 
periodos más largos de confinamiento en la jaula producian un rendimiento pro- 
grestvamente más pobre. De hecho, sólo una rata de cada cinco mostraba una 
retención significativa de las primeras cuatro elecciones después de un periodo de 
24 horas. Esos datos muestran que la memoria espacial no es permanente. Sin 
embargo, dura a] menos varias horas. 

Otra investigación ha mostrado que la memoria de trabajo espacial es especi- 
fica del contexto y, por tanto, claramente inmune a la alteración provocada por 
otras experiencias, En un estudio (Beatty y Shavalia, 1980a), se adiestraron ratas 
en dos laberintos radiales de ocho brazos, idénticos pero localizados en habitacio- 
nes diferentes. Después de completar cuatro elecciones en un laberinto, se les 
llevó a la otra habitación y se les permitió completar cuatro elecciones en el otro 
laberinto. Cuatro horas después de sus elecciones en la primera habitación, se les 
volvió a llevar allí para completar otras cuatro elecciones de corredor. El hallazgo 
más notable fue que las experiencias en el segundo laberinto no alteraban el 
rendimiento cuando se trasladaba otra vez a los sujetos al primer laberinto, aun 
cuando los dos laberintos eran idénticos. El hecho de que los laberintos estuvieran 
localizados en diferentes habitaciones servía, aparentemente, para separar las 
memorias de los lugares visitados en cada habitación (véase también, por ejermn- 
plo, Maki, Brokofsky y Berg, 1979). 
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Figura 11.6. —Porcentaje de res- 
puestas correctas en los intentos 
52.82 en un laberinto radial de 
ocho brazos. Entre los intentos 4 
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tOS a Sus cajas por intervalos 
variables de 0,07 a 24 horas. La 
línea discontinua indica el nivel 
que se obtendría respondiendo 
al azar (41 9%). (Según Beatty y 
Shavalia, 1980b.) 
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Particularidades de las especies en la memoria espacial dentro del laberinto 
radial. Como ya advertimos antes, la prueba del laberinto radial aprovecha la 
tendencia innata de las ratas para evitar los lugares recientemente visitados. Su 
actuación en el laberinto radial puede también estar relacionada con los patrones 
de abastecimiento de las ratas en su hábitat natural. Estas consideraciones sugie- 
ren que la memoria espacial de las ratas investigada en el laberinto radia] puede 
reflejar una adaptación particular de cada especie. Las pruebas en relación con 
este tema no son concluyentes. Los pocos estudios llevados a cabo con es pecies no 
roedoras han sugerido que la memoria espacial de los peces luchadores siameses 
(Betta splendens) y de las palomas es bastante peor que la de las ratas (Bond 
Cook y Lamb, 1981; Roitblat, Tham y Golub, 1982). Sin embargo, otros han 
presentado pruebas de que la memoria espacial de las palomas es, en muchos 
aspectos, comparable a la de las ratas (Olson y Maki, 1983). Otras investigaciones 
tendrán que solucionar esas contradicciones aparentes. Concretamente, deberá 
prestarse una atención especial al diseño de los laberintos que sean igualmente 
apropiados para las distintas especies comparadas, ya que sabemos que ciertas 
características del aparato, tales como el tamaño de la zona de elección central 
pueden influir en la forma en que una especie determinada resuelve el problema 
del laberinto radial (Yoerg y Kamil, 1982). 


La memoria espacial en la recuperación de comida escondida en las aves. En 
un experimento de laberinto radial, los animales tienen que recuperar los trozos 
de comida que el experimentador ha almacenado previamente. Esta situación de 
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laboratorio es análoga a muchas situaciones naturales en que los animales no” 
tienen control sobre la localización de los elementos comestibles. Otro interesante 
problema de la memoria espacial consiste en la recuperación de los alimentos que 
el propio animal almacenó en distintos lugares. En esas circunstancias, la localiza- 
ción de los alimentos está bajo el control del propio sujeto. Varias especies de 
aves, por ejemplo, acumulan comida en distintos lugares sí encuentran más 
comida de la que necesitan en ese momento (véase Shettleworth, 1983b). Des- 
pués visitan esos escondites para recuperar los alimentos almacenados. Esta acu- 
mulación sirve para esconder la comida a los competidores (otras aves, ardillas, 
etcétera) y suministra a las aves comida cuando mo están disponibles en ese 
momento otras fuentes alimenticias. 

El cascanueces de Clark (Nuesfraga columbiana) ofrece un ejemplo espectacu- 
lar. Estas aves viven en zonas alpinas del suroeste de los Estados Unidos y reco- 
lecran piñones al final del verano y principios del otoño. Esconden las semillas en 
escondites bajo tierra y las recuperan muchos meses más tarde, en invierno y 
primavera, cuando escasean otras fuentes de comida. El cascanueces de Clark 
puede almacenar hasta 33.000 piñones en escondites de cuatro o cinco piñones 
cada uno y recuperar varios miles de ellos durante el invierno siguiente. La 
memoria desermpeña un papel muy importante en esta conducta (por ejemplo, 
Balda y Turek, 1984). 

La memoria para la localización de la comida almacenada se ha estudiado 
también en el herrerillo de pantano (Pares palustris), un ave pequeña y bulliciosa 
que se encuentra en Inglaterra y que tiene relación con los chickadees de Nortea- 
mérica. Shertleworth y Krebs (1982) realizaron pruebas con herrerillos de pan- 
tano en un ambiente seminatural que consistía en tres ramas de árbol distribuidas 
en una pajarera (véase figura 11.7). Las ramas tenían unos 100 agujeros pequeños 
taladrados en varios lugares, cada uno del tamaño suficiente como para almacenar 
una semilla de cañamo. Los agujeros se recubrieron con trocitos de tela pequeños 
que las aves tenían que levantar para almacenar la semilla o para buscarla. En el 
primer experimento, las aves eran depositadas en la pajarera y se les permitía 
almacenar 12 semillas. Se les llevaba entonces a uma jaula durante 2-3 horas, 
después de las cuales volvían a la pajarera por un período de recuperación de 12 
minutos. Como promedio, las aves recuperaban de 8 a 12 semillas durante este 
tiempo y cometían pocos errores en la búsqueda. Hallaban con especial precisión 
las primeras 5 semillas, cometiendo sólo un error por semilla aproximadamente. 
Si hubieran estado buscando las semillas al azar, hubieran cometido unos ocho 
errores aproximadamente por cada semilla que encontraban. Otras pruebas indi- 
caban que las aves mo podían detectar las semillas por el olor, pues eran casi 
incapaces de hallar semillas que los experimentadores hubieran almacenado en 
distintos agujeros en vez de ellas mismas. 

El rendimiento llamativamente exacto de los herrerillos de pantano puede 
reflejar la memoria para lugares específicos donde las aves han almacenado las 
semillas. Sin embargo, una posibilidad alternativa importante es que ellos tenían 
un número de puntos favoritos en la pajarera y simplemente iban a ellos cuando 
almacenaban y recuperaban las semillas. Para decidir entre ambas alternativas, 
Shettleworth y Krebs llevaron 2 cabo un segundo experimento en el que las aves 
recibían dos tipos de ensayos. En un tipo de ensayo (almacenamiento-recu- 
peración), se les permitió a las aves almacenar 8 semillas y después se realizaron 
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Figura 11.7. —Ambiente experimental para el estudio con herrerilos de pantano sobre la memoria 

espacial para la comida almacenada. Las fineas indican las trayectorias de vuelo y los escondrijos 

elegidos por un hetrerillo la segunda vez que se le permitió almacenar ocho semillas. Al elegir los 

agujeros para la segunda tanda de semillas (circulos grandes con un punto en el centro), evitó los 

agujeros donde había guardado las semillas de la primera canda (círculos grandes stn punto). Esto 

indica que el pájaro recordaba los lugares que había usado previamente para almacenar semillas. 
(Según Shettleworth, 1983b.) 


pruebas para la recuperación de esas semillas de 2,5 a 3 horas más tarde. En el 
segundo tipo de ensayo (almacenamiento-almacenamiento-recuperación), la pri- 
mera oportunidad para almacenar fue seguida, 2,5 a 3 horas más tarde, por una 
segunda oportunidad para almacenar otras 8 semillas. Esto iba seguido de una 
prueba de recuperación 2,5 a 3 horas después. El procedimiento de almace- 
namiento-almacenamiento-recuperación se diseñó para comprobar la hipótesis de 
la memoria específica. Si las aves recordaban los agujeros específicos donde 
habían almacenado comida previamente, se alejarían de esos lugares durante la 
segunda oportunidad para almacenar porque los agujeros no eran lo suficiente- 
mente grandes para dos semillas. Por el contrario, si siempre acudían a agujeros 
particularmente predilectos, durante la segunda oportunidad de almacenamiento 
intentarían almacenar semillas en los agujeros que ya contenían semillas. Los 
resultados, claramente, favorecían la hipótesis de la mernoria especifica (véase 
figura 11.7). Las aves se alejaban de los agujeros llenos durante la segunda opor- 
tunidad de almacenamiento, pero visitaban esos lugares durante las pruebas de 
recuperación. Así, en vez de ir simplemente a los mismos agujeros favoritos cada 
vez, parecía que recordaban qué agujeros contenían semillas previamente almace- 
nadas. Dado que las estrategias de almacenamiento de comida son adaptaciones 
específicas de la especie, los procesos de memoria implicados en la recuperación 
de comida almacenada en diversos lugares pueden también reflejar especializacio- 
nes adaptativas. 
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Alteración y facilitación de la memoria 


Los ejemplos de memoria de trabajo ilustran la necesidad de una distinción 
entre aprendizaje y memoria porque en ellos interviene la memoria, pero nó el 
aprendizaje. La conducta de elección de las palomas en una prueba de ajuste 
demorado a la muestra, por ejemplo, está determinada por la experiencia pasada 
(exposición previa a los estímulos de muestra), peto esta influencia no es de larga 
duración y, por tanto, mo constituye lo que se suele considerar aprendizaje. El 
concepto de memoria como distinto del de aprendizaje es también necesario para 
explicar los casos en los que el control de la conducta por las experiencias pasadas 
queda alterado o facilitado por procedimientos que no producen un nuevo apren- 
dizaje por sí mismos. Para explicar tales resultados, vamos a suponer que la 
memoria de los sujetos para las experiencias pasadas se ha alterado de alguna 
manera. Existen muchas formas posibles de alterar o facilitar la memoria sin 
producir un nuevo aprendizaje. Podemos, por ejemplo, atarnos un hilo en el dedo 
para acordarnos de llamar a alguien. El hilo en sí no nos dice a quién tenemos que 
llamar, ni cuál es el número de teléfono de esa persona. Más bien facilita nuestra 
memoria de un nombre y un número de teléfono que previamente hemos apren- 
dido. De forma similar, distintas manipulaciones pueden alterar o facilitar la 
memoria de los animales sin producir nuevo aprendizaje. Las experiencias ante- 
riores O posteriores a un hecho pueden influir en la forma en que ese hecho se 
recuerde. La memoria también puede estar influida por claves que indican si va a 
ser importante recordar un hecho. Otros factores que pueden modificar las accio- 
nes basadas en la memoria incluyen tratamientos neurofisiológicos y claves con- 
textuales que están presentes durante la adquisición de una información. Vamos a 
describir cada uno de estos distintos tipos de modificaciones de la memoria. 


La mterferencia proactiva y la interferencia retroactiva. Quizá la causa más 
común de alteración de la memoria sea la exposición a estímulos sobresalientes 
anteriores O posteriores al hecho a recordar. Considérese, por ejemplo, una fiesta. 
St la única persona que no conocemos es el hermano de nuestro vecino, es muy 
probable que no tengamos problema en recordar quién es. Sin embargo, si nos 
presentan a muchas personas antes y/o después de conocer al hermano de nues- 
tro vecino, nos puede resultar mucho más dificil recordar su nombre. Existen 
numerosas situaciones bien documentadas y analizadas en las que la memoria se 
altera por la exposición a un estímulo sobresaliente anterior al hecho a recordar. 
Dado que, en esos casos, el estímulo que interfiere ocurre antes del hecho que nos 
ocupa, la alteración de la memoria se llama interferencia proactiva. En otros 
casos, la memoria se altera por la exposición a un estímulo sobresaliente poste- 
rior al hecho a recordar. Dado que en esas situaciones el estímulo que interfiere 
ocurre después del hecho que nos ocupa, la alteración de la memoria se llama 
interferencia retroactiva. Los mecanismos de la interferencia proactiva y retroac- 
tiva se han investigado extensamente en la memoria humana (Postman, 1971; 
Slamecka y Ceraso, 1960; Underwood, 1957). La interferencia proactiva y la 
retroactiva se han investigado también con animales mediante pruebas en las que 
interviene el ajuste demorado a la muestra (por ejemplo, Grant, 1975; Grant y 
Roberts, 1973, 1976) y la memoría espacial (por ejemplo, Gordon, Brennan y 
Schlesinger, 1976; Gordon y Feldman, 1978; Maki y otros, 1979). 
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Figura 11.8.-—Porcentaje de res- 
puestas correctas en una prueba 
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La interferencia proactiva puede investigarse en el procedimiento de ajuste 
demorado a la muestra exponiendo los sujetos a un estímulo que interfiera inme- 
diatamente antes de la presentación en cada ensayo del estímulo de muestra 
(vease Grant, 1982a; Medin, 1980; Reynolds y Medin, 1981). En el procedimiento 
estándar de ajuste a la muestra se les ofrece una muestra a los animales (digamos 
El), seguida de dos estímulos de elección (digamos El y E2), uno de los cuales 
(El) se ajusta a la muestra. Los sujeros son reforzados sólo por responder al 
estímulo ajustado. En un estudio de interferencia proactiva con monos, la ilumi- 
nación de los paneles del estímulo con una luz roja O con una verde hacía de El y 
de E2 Jarvik, Goldfarb y Carley, 1969). La cámara experimental tenía tres pane- 
les de estímulo colocados en línea. La muestra se presentaba siempre en el panel 
central. Un segundo después de la presentación del estímulo de muestra, los dos 
paneles laterales se ilaminaban con los estímulos de elección. Para investigar los 
efectos de la interferencia proactiva, los sujetos eran expuestos durante 3 segun- 
dos a un estímulo interferente, con intervalos diversos que iban desde 1 hasta 18 
segundos antes de la presentación de la muestra. La clave interferente era siem- 
pre la elección incorrecta en ese ensayo. Si la muestra en un ensayo determinado 
era el color verde, el estímulo interferente consistía en la presentación previa del 
color rojo en la tecla central, y viceversa. Los sujetos también recibían ensayos de 
control que no iban precedidos de la exposición a un estímulo interferente. 

Los resultados se resumen en la figura 11.8. En los ensayos de control, es 
decir, cuando no se presentaba ninguna clave interferente antes de la exposición a 
la muestra, los monos realizaban la elección correcta cast el 100 por 100 de las 
veces. Respondían con menos precisión cuando el estímulo de la muestra iba 
precedido de una clave interferente. Además, cuanto más se aproximaba el esti- 
mulo interferente al estímulo de muestra, mayores eran las alteraciones en el 
rendimiento. No se producía ninguna interferencia proactiva si el estímulo inter- 
ferente se presentaba 8 segundos antes que la muestra. o 

La interferencia retroactiva puede estudiarse en el procedimiento de ajuste 
demorado a la muestra, introduciendo un estímulo interferente entre la exposl- 
ción a la muestra y la presentación de los estímulos a elegir. Es más probable que 
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la memoria para la muestra se altere si en la prueba de ajuste demorado a la 
muestra aparecen claves visuales durante el intervalo de demora, que si intervie- 
nen claves auditivas (por ejemplo, Worsham y D'Amato, 1973; véase también 
Thompsom, Van Hemel, Winston y Pappas, 1983). Quizá el modo más simple de 
presentar los estímulos visuales interferentes sea encender una luz de forma que 
los animales puedan ver distintas características de la cámara experimental. 
Varios experimentadores han mostrado que la iluminación de la cámara experi- 
mental durante el intervalo de demora perjudica la memoria para los estímulos 
visuales en una prueba de ajuste demorado a la muestra (por ejemplo, Grant y 
Roberts, 1976; Worsham y D'Amato, 1973). En cierto experimento, unas palo- 
mas muy expertas en ajuste demorado a la muestra fueron sometidas a pruebas 
con dos claves visuales como muestra y como estímulos de elección (Roberts y 
Grant, 1978). Las claves de la prueba, tres rayas blancas horizontales o verticales 
sobre fondo negro, se proyectaban sobre unas teclas de respuesta circulares en una 
cámara experimental de tres teclas. Los estímulos de elección se presentaban de 0 
a 12 segundos después de la exposición a la muestra, y la cámara experimental se 
iluminaba o se oscurecía durante el período de demora. La figura 11.9 muestra los 
resultados. Los sujetos eligieron correctamente el estimulo ajustado más del 90 
por 100 de las veces cuando no existía demora después del estímulo de la muestra. 
La precisión descendía conforme aumentaba el intervalo entre la muestra y las 
claves de elección. Sin embargo, este descenso en el rendimiento era mucho 
mayor cuando las luces ambientales se encendían durante el intervalo de demora. 
Así, si los sujetos podían ver varias características de la cámara experimental 
durante el intervalo de demora posterior a la exposición a los estímulos de mues- 
tra, su memoria para la muestra se deterioraba. 

Al tratar de interpretar los déficits en el rendimiento observados en las situa- 
ciones de interferencia proactiva y retroactiva, debemos considerar si el déficit 
refleja pérdida (olvido) de la información sobre el estímulo adecuado, o confusión 
sobre qué estímulo era el adecuado. El ejemplo de interferencia proactivadescrito 
arriba (véase figura 11.8) bien pudiera haber reflejado la confusión más que el 
olvido. Aquí, los monos fueron expuestos primero al estímulo incorrecto (el 
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verde, por ejemplo) en un ensayo concreto; se les presentó entonces el estímulo 
de muestra (rojo, en este caso) seguido de una elección entre la muestra y el 
estímulo incorrecto. Los monos probablemente recordaban haber visto los estímu- 
los rojo y verde pero podrían haberse confundido sobre cuál era la muestra o cuál 
había sido presentado primero (D'Amato, 1973), y esta confusión puede haber 
conducido al efecto de interferencia proactiva. 

Muchos estudios de interferencia proactiva pueden explicarse en términos de 
algún tipo de confusión entre la muestra y el estímulo interferente antes que en 
términos de olvido de la muestra. Una manera de distinguir entre esas alternati- 
vas es considerar la importancia de la semejanza entre el estimulo interferente y 
el estímulo de muestra. De acuerdo con la hipótesis de la confusión, la semejanza 
entre el estímulo interferente y el estímulo de muestra debería ser importante 
para determinar el grado de interferencia porque cuanto más similares sean esos 
dos hechos, más probable será que se confundan. La investigación ha confirmado 
la importancia de la semejanza de los estímulos en los estudios de interferencia 
proactiva (por ejemplo, Reynolds y Medin, 1981). Por el contrario, los estudios de 
interferencia retroactiva han favorecido la interpretación del olvido (Cook, 1980; 
Roberts y Grant, 1978; Thompson y otros, 1983). Se han observado alteraciones 
en el rendimiento en los estudios de interferencia retroactiva en casos en los que 
los estímulos no podían causar errores por confusión (Wright, Urcuioli, Sands y 
Santiago, 1981). Dado que en el procedimiento de interferencia retroactiva el 
estímulo interferente tiene lugar después del estímulo central, puede causar 
olvido al alterar la presentación del estímulo de muestra. 


El olvido dirigido. En las situaciones de interferencia proactiva y retroactiva, 
los errores son resultado involuntario de la exposición a los estímulos interferen- 
tes y se penalizan con un no reforzamiento. Por el contrario, en los procedimien- 
tos de olvido dirigido, el olvido es un resultado intencionado, producto de claves 
que indican que los sujetos no van a necesitar recordar un estímulo de muestra 
concreto, Se han llevado a cabo muchas investigaciones que indican que la actua- 
ción de la memoria humana puede modificarse mediante instrucciones de que 
algo va a ser o mo importante de recordar (por ejemplo, Bjork, 1972). Estas 
investigaciones han despertado el interés por hallar efectos análogos de olvido 
dirigido en la investigación con sujetos animales. Los investigadores entendieron 
que si el mantenimiento de la información en la memoria de trabajo implicaba 
algún tipo de proceso de repetición (Wagner, 1976), este proceso podría estar 
sujeto a control por el estímulo, lo que permitiría demostrar la existencia .del 
olvido dirigido en la memoria de trabajo de los animales. En los últimos años, el 
olvido dirigido ha sido demostrado en las palomas, ratas, ardillas y monos (Grant, 
1982b; Maki y Hegvik, 1980; Roberts, Mazmanian y Kraemer, 1984; para una 
revisión, véase Rilling, Kendrick y Stonebraker, 1984). 

En un experimento (Stonebraker y Rilling, 1981) se utilizó una variación con 
palomas del experimento de ajuste demorado a la muestra. Como estímulo de 
muestra al comienzo del ensayo, una tecla circular de picoteo se iluminaba con 
una luz roja o verde. El primer picotazo, trancurridos 12 segundos, hacía cesar la 
muestra y establecía un intervalo de demora de 4 segundos, después de los cuales 
la clave luminosa, roja o verde, se encendía de nuevo. Si el color, tras el intervalo 
de demora, se ajusta al de la muestra (rojo-rojo, verde-verde), los picotazos en la 
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tecla se reforzaban con comida. Si el color, después del intervalo de demora, no se 
ajusta al de la muestra (rojo-verde o verde-rojo), los picotazos en la tecla no 
terminaban en reforzamiento. Así pues, una ejecución precisa requería memoria 
para el color de la muestra con la que comenzaba cada ensayo. Sin embargo, a 
diferencia del procedimiento de ajuste a la muestra que discutimos anteriormente, 
en este procedimiento los estímulos de comparación ajustado y no ajustado no se 
presentaban juntos al fina! del intervalo de retención. Este tipo de procedimiento 
se llama ajuste sucesivo demorado a la muestra. 

El entrenamiento de olvido dirigido se estableció después de que los sujetos 
habían aprendido a actuar con precisión en el procedimiento de ajuste demorado 
a la muestra. Una serie de líneas horizontales y otra de líneas verticales sobre 
fondo blanco proyectadas en una tecla de respuesta servían como claves de 
recuerdo (R) y de olvido (O). En cada ensayo se presentaba brevemente (1/2 
segundo) uno u otro de esos patrones inmediatamente después de la muestra —el 
color rojo o verde—. En los ensayos con la clave R, la memoria se ponía a prueba 
de la forma habitual: al final del intervalo de demora se presentaba el color rojo o 
verde y se reforzaban las respuestas sólo si aparecía el color ajustado. (Para ase- 
gurarse de que las palomas mirarían la tecla de respuesta cuando el estímulo de 
prueba se presentara, somaba brevemente un tono simultáneo al estímulo de 
prueba.) En los ensayos con la clave O, no se comprobaba la memoria al final del 
intervalo de demora; simplemente, el ensayo terminaba después de que la clave O 
se presentara. Las palomas aprendían rápidamente que la clave O siempre termi- 
naba sin oportunidad de reforzamiento, y se alejaban de la tecla de respuestas al 
ver la clave O. 

Los daros esenciales del experimento se obtenían al final del entrenamiento ' 
del olvido dirigido, en ensayos especiales de prueba. Los ensayos de prueba eran 
como los ensayos de entrenamiento, excepto que la memoria para el estímulo de 
muestra se ponía a prueba incluso cuando la exposición a la muestra era seguida 
de la clave de olvido. De esta forma, los ensayos de prueba median la precisión de 
la memoria posterior tanto a la clave R como a la clave O, para ver si la memoria 
empeoraba después de la exposición a una clave de olvido. Otro factor de interés 
lo constituía la cantidad de tiempo transcurrido entre la presentación del estímulo 
de muestra y la presentación de la clave de recuerdo o de olvido. En algunos 
ensayos de prueba, las claves R y O se presentaron inmediatamente después del 
estímulo de muestra. En otros ensayos, las claves R y O se presentaban 2 o 3,5 
segundos después de la muestra, durante el intervalo de retención. 

La figura 11.10 muestra los resultados de las pruebas de memoria en términos 
del porcentaje de picotazos en el estímulo de comparación correcto (ajustado) 
respecto al número total de picotazoz n los ensayos de prueba con la clave de 
recuerdo, cerca del 90 por 100 de las respuestas se daban en el estímulo correcto, 
con independencia del momento de presentación de la clave respecto al estímulo 
de muestra. Así pues, las palomas habían aprendido a actuar muy bien en el 
problema de ajuste demorado. Se obtuvieron resultados espectacularmente dife- 
rentes en los ensayos de prueba con la clave de olvido. Cuando la clave de olvido 
se presentaba inmediatamente después del estímulo de muestra, el rendimiento 
en la prueba de memoria caía por debajo del 60 por 100, resultado próximo al 
rendimiento al azar (50 por 100) para esa tarea. Así pues, la clave de olvido 

producía un descenso sustancial en la actuación durante la prueba de memoria, 
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Pigara 11.1 0.—Porcentaje de res- 
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cuerdo entre O y 0,35 segundos 
después del estímulo de muestra. 
En los ensayos con clave Ú se 
presentaba una clave de olvida 
después del estímulo de muestra. 
(Según Stonebraker y Rilling, 
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Cuando la clave de olvido se presentaba 2 O 3,5 segundos después de RR 
durante el intervalo de retención, progresivamente se producía menos a ns 
Resultados como los de la figura 11.10 se corresponden con una a 
ción por olvido dirigido. Las palomas podrían haber actuado con is 0 
en los ensayos de prueba con la clave de olvido que en los ensayos A P Pes 
la clave de recuerdo, porque la clave O alteraba los mecanismos de alma: 
miento de información de la memoria de trabajo. Tan atractivas E esta E 
pretación pueden ser otras alternativas que se han evaluado. Un pro a por 
tante es el que se refiere al procedimiento que se utilizó para e a O 
con la clave de olvido. En los ensayos de entrenamiento con la O e olvi No 
sujetos no pasaron por pruebas de memoria Con el estímulo d o E 
poco recibieron reforzamiento. La interpretación que recurre a la a is EE 
memoria considera que la ausencia de la prueba de memoria fue palos Bd 
estudios han mostrado que la ausencia de reforzamiento en los eLo e E 
namiento con claves O es importante para los efectos del olvido pla He mel 
Hegvik, 1980; Maki, Olson y Rego, 1981). Sin embargo, Otros han obteni: e 
ros de olvido dirigido incluso cuando a los sujetos se les permitía ada : 
zamiento en los ensayos de entrenamiento con la clave O (por ao O, di 
1982b). (Esto se lograba permitiendo a los sujetos que obtuvieran re ren a 
dedicándose a una tarea paralela que no requería el uso de la memoria.) ia . 
los efectos del olvido dirigido no Pata que la clave de olvido se condicion 
ñal para la ausencia de reforzamiento, 
A ncleóE importante es determinar si las claves O en a es a 
trabajo especificamente, O si producen una alteración más genera! de Ja C Lo 
instrumental discriminativa. Maki y otros (1981, Experimento 7 O a 
esta posibilidad en palomas, estudiando si una clave O alteraba e A e 
una prueba simultánea de discriminación que no requiriera memoria, Se p 155 
ron simultáneamente en dos teclas estímulos que consistian En patrones de 
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horizontales y verticales, y se reforzaba el picoteo en uno de los patrones. La 
presentación de una clave de olvido no alteraba de forma significativa la ejecución 
de discriminación simultánea. Este resultado indica que las claves O no producen 


un efecto de alteración general sobre el control por el estímulo de la. conducta 


instrumental. | 

Por último, es importante considerar qué tipo de mecanismo de retención de 
la información resulta alterado por las claves de olvido. Una posibilidad es que la 
memoria sea un proceso de carácter central localizado en algún lugar del cerebro. 
Otra alternativa es que la información se mantuviera en la conducta patente del 
animal. Las. personas, por ejemplo, se pueden repetir varias veces un número de 
teléfono para recordarlo hasta el momento de marcarlo, Algunos casos de olvido 
dirigido pueden suponer la alteración de esa mediación de la respuesta patente 
durante el intervalo de demora, Este puede haber sido el caso en el estudio de 
Stonebraker y Rilling (1981). En la figura 11.10 se resumen los resultados de las 
pruebas de memoria posteriores a las claves R y O. Stonebraker y Rilling midie- 
ron también el número de veces que las palomas picoteaban la tecla de estímulo 
durante el intervalo de retención entre la presentación de la muestra y los colores 
de comparación. La figura 11.11 muestra la tasa de este picoteo durante el inter- 
valo de retención en distintas condiciones de prueba. El hallazgo notable fue que 
la presentación de la clave O no sólo alteraba la precisión'de la memoria (figura 
11.10), sino que también alteraba el picoteo del intervalo de demora (figura 
11.11). De hecho, fueron llamativamente similares los efectos sobre la precisión 
de la memoria y sobre el picoteo en el intervalo de demora. Esto aumenta la alta 
posibilidad de que los efectos del olvido dirigido se deban a la alteración de la 
conducta patente de mediación. Es necesaria una investigación adicional que 
determine de qué forma interviene la conducta patente de mediación en éste y 
otros ejemplos de olvido dirigido. 


Figura 11.11. —Velocidades de pi- 
250 coteo durante el intervalo de re- 
a tención de un procedimiento de 
ajuste sucesivo demorado a la 
muestra con palomas. (Véase la 
figura 11.10 para detalles adicio- 
nales.) (Según Stonebraker y 
Rilling, 1981.) 
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Medios neurofisiológicos de alterar la memoria. Las alteraciones de la 
memoria que hemos considerado hasta ahora (la interferencia proactiva y tetroac- 
tiva y el olvido dirigido) fueron producidas por hechos que por sí mismos no se 
pueden considerar alterantes, Fueron factores extrínsecos a los propios estímulos 
los que convirtieron en alterantes los hechos interferentes y las claves de olvido. 
En la interferencia proactiva y retroactiva, los factores extrínsecos implicaban 
relaciones temporales y secuenciales del hecho interferente con la información 
que debía recordarse; en el olvido dirigido, el factor extrínseco era que la clave de 
olvido estaba condicionada como señal para la ausencia de una prueba de memo- 
ria. Por el contrario, las claves neurofisiológicas de alteración de la memoria que 
vamos a considerar a continuación están producidas por hechos que son inheren- 
temente alterantes, tales como la lesión cerebral producida por una enfermedad o 
por un trauma accidental. Una persona que recibe un fuerte golpe en la cabeza 
puede sufrir amnesia (pérdida de memoria) como resultado. Lo más probable es 
que esa persona olvide los hechos que ocurrieron inmediatamente antes de la 
lesión y que recuerde experiencias anteriores. Es decir, la persona puede olvidar la 
forma en que ocurrió el golpe, dónde ocurrió el accidente y quién más estaba allí. 
Sin embargo, seguirá recordando otra información de largo alcance, como su 
nombre y dirección, o los nombres y edades de sus hermanos y hermanas. El 
primer estudio extenso en seres humanos sobre pérdida de memoria tras una 
lesión en el cerebro fue llevado a cabo por Russell y Nathan (1946). En general, 
hallaron que existe un gradiente temporal de pérdida de memoria que disminuye 
hacia atrás a partir del momento de la lesión. Cuanto más cerca está un episodio 
del momento de la lesión, más probable es que la persona olvide esa información. 
Este fenómeno se llama amnesia retrógrada. 

La amnesia retrógrada ha sido extensamente estudiada en experimentos de 
laboratorio con animales. En los primeros estudios de este tipo se utilizaron des- 
cargas electroconvulsivas (DEC) para inducir la amnesia. Las descargas electro- 
convulsivas, introducidas como tratamiento para la enfermedad mental hace 
muchos años (Cerletti y Bini, 1938), son corrientes eléctricas breves que pasan a 
través del cerebro entre electrodos colocados a ambos lados de la cabeza. No se 
sabe exactamente cómo la DEC produce cambios en los pacientes con alteraciones 
mentales. Los investigadores que estaban interesados en la memoria empezaron a 
estudiar los efectos de las DEC porque los pacientes informaban con frecuencia 
que sufrían de amnesia después de un tratamiento con DEC (por ejemplo, Mayer- 
Gross, 1943). 

En la primera investigación de laboratorio sobre los efectos de la DEC, Dun- 
can (1949) adiestró a unas ratas para que ejecutaran la respuesta instrumental con 
el fin de evitar la estimulación aversiva. Se llevaba a cabo un ensayo de condicio- 
namiento en cada uno de los 18 días que duró el adiestramiento. Todos los suje- 
tos, excepto los sujetos del grupo de control, recibían una descarga electroconvul- 
siva después de cada ensayo de adiestramiento. En grupos independientes de 
animales, se administraba una DEC en distintos momentos, desde 20 segundos a 
4 horas después de los ensayos de entrenamiento. La cuestión de interés era saber 
si la DEC alteraba, y hasta qué punto, el aprendizaje de la tarea. En la 
figura 11.12 se resumen los resultados. Los sujetos tratados con una descarga elec- 
troconvulsiva 1 hora o más después de cada ensayo de entrenamiento rendían 
igual en la prueba de evitación que los sujetos del grupo de control, que no reci- 
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14 Figura 11.12. —Número medio de 
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bían DEC. Por el contrario, sí resultaba alterado el rendimiento de los animales a 
los que se les había administrado una DEC en los 15 minutos posteriores a los 
ensayos de entrenamiento. De hecho, se observaba un gradiente de interferencia: 
cuanto más cercana a los ensayos de entrenamiento era la administración de la 
DEC, producía una actuación de evitación más pobre. 

El patrón de resultados que obtuvo Duncan se corresponde con una interpre- 
tación por amnesia retrógrada, Se supone que la descarga electroconvulsiva pro- 
duce un gradiente de amnesia tal que los hechos cercanos a la DEC no se recuer- 
dan tan bien como los hechos anteriores. Por tanto, st la administración de la 
DEC se realiza poco después del ensayo de condicionamiento, la retención de esa 
experiencia de condicionamiento queda alterada en mayor medida que sí la DEC 
se administra tras un período más largo. Es posible explicar los resultados de 
Duncan sin el concepto de amnesia (por ejemplo, Coons y Miller, 1960). Sin 
embargo, numerosos experimentos posteriores han aportado pruebas convincen- 
tes de amnesia retrógrada inducida, experimentalmente, en una amplia variedad 
de tareas de aprendizaje (véase McGaugh y Herz, 1972; Spear, 1978, para revi- 
siones). Además, estos experimentos han mostrado que la amnesia retrógrada 
puede estar producida por muchos tratamientos que afectan al sistema nervioso, 
incluyendo la anestesia (McGaugh y Petrinovich, 1965), el enfriamiento temporal 
del cuerpo, o hipotermia (Riccio, Hodges y Randall, 1968), y la inyección de 
drogas que inhiben la síntesis de proteinas (por ejernplo, Flexner, Flexner y Ste- 
llar, 1963). 

¿Por qué los tratamientos tales como la DEC producen una pérdida gradual de 
memoria? Una explicación de la amnesia retrógrada es la hipótesis de la consoli- 
dación de la memoria (véase McGaugh y Herz, 1972). Esta hipótesis sostiene que, 
cuando un hecho se experimenta por primera vez, se encuentra en un estado 
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APARTADO 11.2. La amnesia rerrógada en los pacientes de Korsakoff 


En el apartado 6.2 describimos algunas investigaciones sobre los problemas de la 
memoria a corto' plazo de los pacientes de Korsakoff. Los pacientes con el sindrome de 
Korsakoff inducido por el alcohol también mostraban amnesia retrógrada. Es decir, estos 
individuos rienen dificultad para recordar hechos de su pasado, en particular aquellos 
hechos cercanos a la aparición de la enfermedad. Por ejemplo, Butters y Cermak (1980) 
preguntaron en 1975 a un paciente recién diagnosticado sí los Estados Unidos estaban aún 
en guerra. «Creo que ahora andan liados en la guerra de Corea» fue su respuesta, igno- 
rando la guerra del Viernam, más reciente. Usando gráficos, los investigadores han expre- 
sado de varias formas interesantes el gradiente de pérdida de memoria en pacientes de 
Korsakoff. La figura 11.13 resume los datos de un estudio que compara a las personas 
normales con los pacientes de Korsakoft (Alberr, Butters y Levin, 1979). En este estudio, 
a cada sujeto se le pidió que identificara a gente famosa en unas fotos. Las personas 
focografiadas habían sido famosas durante alguna de las cinco décadas entre 1930 y 1970 
(por ejemplo, Tiny Tim, Rosemary Clooney). Como muestra la figura 11.13, los pacientes 
de Korsakofí reconocieron a menos personas que los sujetos normales. Y lo que es más 
importante, el grado de reconocimiento iba disminuyendo cuanto más reciente era la foto. 
La memoria de reconocimiento de cada personaje empeoraba a medida que la época en la 
que el personaje fue farnoso se aproximaba al momento de inicio de la enfermedad. Este 
gradiente es indicativo de la amnesia retrógada. Estudios como éste forman parte de un 
cuerpo creciente de investigaciones que van aumentando nuestra comprensión de la 
memoria y de los décifits de la memoria que se producen como resultado de lesiones 
neurológicas. 

100 Figura 11.13, —Porcentaje me- 
dio de fotografías de gente 
famosa de distintas décadas 
correctamente identificadas 
por la gente mormal y por 
los pacientes de Korsakoff 
Gente corriente (Según Albert, Butters y Le- 
vin, 1979.) 
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temporal, o de corto plazo. En la memoria a corto plazo, la información es vulne- 
rable y puede perderse debido a la presentación de estímulos interferentes u otras 
manipulaciones alterantes. Sin embargo, si se encuentran las condiciones adecua- 
das, gradualmente la información se consolida de una forma relativamente per- 
manente. Se supone que la consolidación de la memoría es un tipo de proceso 
fisiológico que sitúa la información, de forma gradual, en un estado permanente, 
o de largo plazo. Los trastornos neurofisiológicos tales como la descarga electro- 
convulsiva, la anestesia, el enfriamiento del cuerpo, o la inhibición de la síntesis 
de proteinas, se supone que interfieren con el proceso de-consolidación, y por esa 
razón alteran la transferencia de información a la memoria de largo plazo. La 
alteración de la consolidación produce amnesia sólo para la información almace- 
nada en la memoria de corto plazo. Una vez que la información se ha consolidado 
y transferido a la memoria de largo plazo, no puede perderse a causa de las 
alteraciones de la consolidación. Los agentes amnésicos dan lugar a una pérdida 
de memoria para los hechos recientemente experimentados, pero no para las 
experiencias anteriores, posiblemente porque sólo los hechos recientes se encuen- 
tran en la memoria de corto plazo y, por tanto, son susceptibles de sufrir altera- 
ciones en su consolidación. 

Las alteraciones en el rendimiento causadas por agentes ammnésicos pueden 
también explicarse de una forma muy diferente. De acuerdo con esta explicación 
alternativa, la amnesia proviene no de una pérdida de memoria, sino de la incapa- 
cidad de recuperar la información del sistema de almacenamiento de largo plazo 
(Lewis, 1979; Miller y Springer, 1973; Riccio y Richardson, en imprenta; Spear, 
1973). Esta explicación se llama hipótesis del fallo en la recuperación. El término 
recuperación se refiere a la reutilización de información de la memoria de largo 
plazo. La hipótesis de la consolidación y la del fallo en la recuperación pueden 
ilustrarse con uma analogía. Para estar seguros de que no se nos va a perder la 
información del testamento de nuestro abuelo, podemos decidir depositarlo (el 
testamento) en una caja fuerte. Nuestro abuelo muere un tiempo después y nos 
encontramos con que somos incapaces de presentar el testamento para ver lo que 
contiene. ¿Por qué razón podríamos ser incapaces de tener acceso a la informa- 
ción del testamento? Una posibilidad es que el testamento nunca hubiera sido 
depositado en la caja de seguridad. Quizá lo perdimos de camino al banco. Este 
tipo de pérdida es análogo a un fallo de consolidación. La alternativa consiste en 
que el testamento esté de hecho en la caja de seguridad, pero hayamos perdido la 
llave de la caja o no recordemos dónde está la caja. Este tipo de pérdida es aná- 
loga al fallo de recuperación. 

La distinción entre explicaciones teóricas alternativas como las del fallo en la 
consolidación y el fallo en la recuperación no es Importante si no podemos encon- 
trar pruebas para decidir entre las dos. ¿Qué tipo de resultados experimentales 
favorecerían una explicación en lugar de la otra? La hipótesis del fallo en la 
consolidación establece que una vez que se pierde la memoria no puede ser recu- 
perada. Por el contrario, el punto de vista del fallo en la recuperación sostiene que 
la amnesia puede anularse si se halla el procedimiento adecuado para «recordar» 
los temas almacenados en la memoria. Así pues, para decidir entre las alternati- 
vas tenemos que encontrar técnicas que puedan anular los efectos de los agentes 
amnésicos. Se han desarrollado varios procedimientos de este tipo, algunos de los 
cuales se describen en la sección siguiente. El hecho de que la amnesia pueda 
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anularse convierte en muy difícil, si no imposible, la verificación de la hipótesis 
de la consolidación de la memoria. Dado que muchas memorias presumiblemente 
«perdidas» se han reactivado mediante diversos tratamientos de recuerdo, es 
posible afirmar que toda pérdida de memoria representa un fallo en la recupera- 
ción más que un fallo en la consolidación (Miller y Springer, 1973). Aun cuando 
un tratamiento de recuerdo resulte ineficaz para anular un caso de amnesia, no 
podemos nunca estar seguros de que no vamos a lograr éxito con algún otro 
tratamiento de reactivación. Asi pues, no se puede asegurar que una memoria es 
irrecuperable, como sostiene la teoría del fallo en la consolidación. 


La facilitación de la recuperación de la memoria con tratamientos «recordato- 
rios». Numerosos experimentos han mostrado que la memoria de ensayos de 
condicionamiento previo puede ser reinstalada exponiendo a los sujetos a algunos 
aspectos de los estímulos que estaban presentes durante los ensayos de entrena- 
miento (véase las revisiones de Gordon, 1981; Spear, 1976, 1978). En las prime- 
ras investigaciones de este fenómeno se utilizó, a menudo, como tratamiento 
«recordatorio», la exposición al reforzador con independencia de la conducta. En 
un experimento, por ejemplo, la pérdida de memoria producida por una descarga 
electroconvulsiva fue contrarrestada exponiendo a los sujetos al estímulo aversivo 
incondicionado antes de realizar la prueba de retención (Quartermain, McEwen y 
Azmitia, 1970). Sin embargo, se han criticado los experimentos en los que el 
episodio «recordatorio» contiene el estímulo incondicionado, con el argumento de 
que esos procedimientos permiten que se produzca un nuevo aprendizaje (por 
ejemplo, Gold, Haycock, Macri y McGaugh, 1973; Schneider, Tyler y Jinich, 
1974). Si el tratamiento «recordatorio» produce un nuevo aprendizaje, el mejor 
rendimiento de aquellos sujetos a los que se les ha dado este tratamiento pudiera 
deberse al nuevo aprendizaje más que al restablecimiento o recuperación de una 
antigua memoria. 

Es importante considerar la posibilidad de un nuevo aprendizaje siempre que 
evaluemos los efectos de los tratamientos «recordatorios». Sin embargo, muchos 
aspectos de las investigaciones recientes sobre facilitación de la recuperación de 
memoria son difíciles de explicar utilizando la hipótesis del nuevo aprendizaje. 
Quizá el modo más convincente de asegurarnos de que un tratamiento «recorda- 
torio» no produce un nuevo aprendizaje es utilizar un ensayo de extinción para 
restablecer la antigua memoria. Varios experimentos han demostrado la facilita- 
ción de la recuperación de memoria con un ensayo de extinción. En un estudio de 
éstos (Gordon y Mowrer, 1980), fueron condicionados cuatro grupos de ratas para 
dar una respuesta de evitación de dirección única. El aparato consistía en dos 
compartimentos, uno blanco y otro negro. Al principio de cada ensayo, el sujeto 
era colocado en el compartimento blanco. Varios segundos después se abría la 
puerta que daba al compartimento negro y, simultáneamente, se producía ur des- 
tello de luz. Si el sujeto cruzaba al lado negro en cinco segundos evitaba la des- 
carga. Si no cruzaba a tiempo, se presentaba la descarga hasta que la rata entraba 
en el compartimento negro. Los sujetos recibían ensayos repetidos de condicio- 
namiento hasta que lograban evitar la descarga en tres ensayos consecutivos. 
Inmediatamente después de este entrenamiento se les dio a dos grupos de ratas 
una descarga electroconvulsiva para inducirles amnesia. 

La memoria de la respuesta de evitación se comprobó 72 horas después de que 
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terminara el entrenamiento. Durante la prueba de retención, los sujetos recibie- 
ron cinco ensayos que se llevaron a cabo del mismo modo que durante el condi- 
cionamiento, excepto que ahora la descarga eléctrica mo se administraba, cual- 
quiera que fuera el tiempo que tardaran las ratas en cruzar al lado negro. El 
aspecto más importante del experimento consistía en realizar un ensayo de extin- 
ción («recordatorio») con algunos sujetos, 15 minutos antes del comienzo de la 
prueba de retención. Este tratamiento «recordatorio» consistía en colocar a las 
ratas en el compartimento blanco del aparato durante 60 segundos con la luz 
encendida dando destellos. No se administraba ninguna descarga al final de esta 
exposición al estímulo. Normalmente, esperaríamos que ese ensayo de extinción 
disminuyera la conducta de evitación. La cuestión esencial era saber si el ensayo 
de extinción disminuiría el rendimiento de las ratas transformadas en amnésicas 
mediante descargas electroconvulsivas. Si el ensayo de extinción sirve como tra- 
tamiento recordatorio después de la DEC, facilitando la recuperación de la memo- 
ría del condicionamiento de evitación, debería facilitar la conducta de evitación. 

En la figura 11.14 se resumen los resultados del estudio. Los datos se presen- 
tan en términos de la latencia de las respuestas de evitación durante la prueba de 
retención. Las puntuaciones más bajas indican que los sujetos ejecutaron más 
deprisa la conducta de evitación. Las puntuaciones más altas indican un rendi- 
miento menor. Vamos a considerar primero los dos grupos de ratas a los que no 
se les dieron descargas electroconvulsivas. En esos sujetos, la administración del 
ensayo de extinción recordatorio 15 minutos antes de la prueba de retención dio 
lugar a una conducta de evitación más lenta. Este es el resultado normal de la 
extinción. Á continuación, vamos a considerar los resultados con los sujetos que 
habían recibido DEC. La descarga electroconvulsiva en ausencia de un tratamiento 


Figura 11.14 —Latencia de la res- 
puesta de evitación durante una 
prueba de retención con cuatro 
grupos de ratas. A dos de los 
grupos no se les dieron descar- 
gas electroconvulsivas (DEC) 
después del adiestramiento, y 
fueron puestos a prueba, bien 
después de un ensayo de extia- 
ción recordatorio, o bien sin el 
ensayo recodatorio. Los otros dos 
grupos fueron tratados con DEC 
después del adiestramiento y 
también fueron sometidos a prue- 
ba tanto con el ensayo de extin- 
ción recordatorio como sin él, 
(Según Gordon y Mowrer, 1980.) 
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de recuerdo (DEC, ausencia de «recordatorio») produjo las respuestas más lentas 
de evitación. Este resultado indica que la DEC producía una amnesia de los ensa- 
yos de evitación. Sin embargo, si a los sujetos tratados con DEC se les daba 
también un ensayo de extinción recordatorio antes de la prueba de retención, su 
rendimiento mejoraba mucho. De hecho, las ratas sometidas a DEC a las que se 
les dio un tratamiento recordatorio respondieron tan rápido como los sujetos que 
no habían recibido DEC, ni ensayo de extinción. Esos resultados sugieren que el 
tratamiento recordatorio restauraba totalmente la memoria del entrenamiento de 
evitación previo. Asi pues, los efectos amnésicos de la DEC se eliminaban expo- 
niendo al sujeto al ensayo de extinción. Ya que el ensayo de extinción producía un 
descenso en el rendimiento en ausencia de la DEC, esos resulrados no pueden 
explicarse como un nuevo aprendizaje producido por el tratamiento recordatorio. 

En los últimos años se ha aprendido mucho acerca de la facilitación de la 
recuperación de memoria mediante tratamientos recordatorios (véase Gordon, 
1981; Spear, 1976, 1978, 1981). Se han encontrado diversos procedimientos 
recordatorios que facilitan la recuperación de la memoria, además de la exposición 
al reforzador solo o al estímulo condicionado solo. Otros tratamientos recordato- 
rios eficaces han incluido la exposición a los estímulos de fondo de la sala expe- 
rimental (por ejemplo, Deweer, Sara y Hars, 1980), la exposición a luces y soni- 
dos en la cámara experimental (Thomas, McKelvie, Ranney y Moye, 1981), la 
exposición a claves interoceptivas creadas por una inyección de pentobarbital 
(Spear y otros, 1980), y la exposición al estímulo no reforzado en un procedi- 
miento de discriminación (Campbell y Randali, 1976). La memoria recuperada 
mediante un tratamiento recordatorio es igual a la memoria recuperada directa- 
mente por la presentación de un estímulo condicionado (Rovee-Collier, Sullivan, 
Enright, Lucas y Fagan, 1980; Spear, Hamberg y Bryan, 1980). Otra semejanza es 
que las memorias recuperadas mediante claves son susceptibles de alteración por 
los agentes productores de amnesia, tales como la descarga electroconvulsiva o el 
enfriamiento corporal. Así pues, la administración de DEC o la hipotermia tras 
un tratamiento recordatorio alteran la memoria de la experiencia de condiciona- 
miento origimal (Mactutus, Ferek, George y Riccio, 1982; Mactutus, Riccio y 
Ferek, 1979; Misanin, Miller y Lewis, 1968). 

Por último, los tratamientos recordatorios pueden utilizarse para anular 
varios casos de descenso en la respuesta, además de la pérdida de memoria debida 
a la administración de agentes productores de amnesia como la DEC. Los trata- 
mientos recordatorios pueden, por ejemplo, facilitar la recuperación de memoria, 
a partir de la memoria de corto plazo (Feldman y Gordon, 1979). También pue- 
den lograr que los animales más viejos (y los bebés) recuerden experiencias de la 
primera época de su vida (por ejemplo, Campbell y Randall, 1976; Fagan y 
Rovee-Collter, 1983; Haroutunian y Riccio, 1979; Richardson, Riccio y Jonke, 
1983). Los tratamientos recordatorios pueden contrarrestar los descensos por 
generalización del estímulo que se producen cuando se pone a prueba una con- 
ducta aprendida en otra situación. (Gordon, McCracken, Dess-Beech y Mowrer, 
1981; Mowrer y Gordon, 1983). Los tratamientos recordatorios pueden también 
compensar las alteraciones en la conducta que se observan habitualmente en los 
procedimientos de condicionamiento clásico de eclipsamiento y bloqueo (Kas- 
prow, Cacheirro, Balaz y Miller, 1982; Schachtman, Gee, Kasprow y Miller, 1983). 
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Interrelaciones del aprendizaje y la memoria 


Hasta ahora nos hemos centrado en varios fenómenos conductuales que 
implican manipulaciones de la memoria más que fenómenos de aprendizaje. Sin 
embargo, como ya advertimos antes, la memoria interviene sin duda en el apren- 
dizaje. Si los organismos fueran incapaces de recordar hechos pasados, el aprendi- 
zaje no podría producirse. Los avances en nuestro conocimiento de los mecanis- 
mos de la memoria en los animales han venido acompañados por un interés 
creciente por integrar esta información con los análisis del aprendizaje. Vamos a 
considerar dos ejemplos de esta integración: un análisis del papel de la práctica de 
recuperación en el aprendizaje y un análisis del papel de la repetición en el 
aprendizaje y en la memoria . 


Reconsideraciones de la curva de aprendizaje. En la mayoría de las tareas de 
aprendizaje, el rendimiento medio de un grupo de sujetos mejora gradualmente a 
lo largo del entrenamiento (veáse, por ejemplo, figura 4.10). Esta mejora gradual 
se interpreta, generalmente, como un reflejo de la adquisición progresiva de un 
nuevo conocimiento —el conocimiento de la relación entre un EC y un El o entre 
una respuesta y un reforzador, por ejemplo—. Conforme los sujetos van adquí- 
riendo más conocimiento, su rendimiento mejora progresivamente. Sin embargo, 
las investigaciones sobre los mecanismos de memoria sugieren que, además de la 
adquisición de un nuevo conocimiento, otros procesos pueden contribuir también 
a la mejora del rendimiento en función del número de ensayos de entrenamiento. 
Cada ensayo de condicionamiento contiene algo más que la mera información que 
el sujeto tiene que aprender. En un experimento de condicionamiento clásico, por 
ejemplo, cada ensayo de condicionamiento puede implicar la exposición a estímu- 
los condicionados e incondicionados. Como ya hemos visto, la exposición al EC y 
al El puede ser un eficaz recordatorio, o clave de recuperación, de los ensayos de 
condicionamiento anteriores. Por tanto, un ensayo de condicionamiento puede no 
sólo aportar una nueva información al sujeto, sino también recordar al sujeto 
ensayos anteriores. Las mejoras en el rendimiento observadas a medida que trans- 
curre la adquisición pueden reflejar en parte las funciones recuperantes de los 
ensayos de entrenamiento. 

En un estudio con ratas sobre aprendizaje de laberinto, Miller (1982) inves- 
tigó recientemente la posibilidad de que los ensayos de condicionamiento contri- 
buyeran a la mejora en el rendimiento al actuar como claves de recuperación. El 
entrenamiento tenía lugar en un laberinto algo complejo (el laberinto de Lash- 
ley ID, que se muestra en la figura 11.15. Para ir desde la salida hasta la caja 
meta, las ratas tenían que aprender a torcer varias veces a la derecha y a la 
izquierda. Las entradas en callejones sin salida se puntuaban como errores. Los 
sujetos realizaban un ensayo en el laberinto un día sí y otro mo. Todas las ratas 
tenían sed en el momento del ensayo, y la mitad de ellas fueron reforzadas por 
alcanzar la caja meta con el acceso a una solución de azúcar. Para la otra mitad de 
las ratas, el suelo del laberinto transmitía una corriente eléctrica suave al 
comienzo de cada ensayo, y el escape de la descarga hacía de reforzador. El interés 
primordial del experimento residía en la administración de tratamientos recorda- 
torios 24 horas después de los ensayos 3 y 4. Los tratamientos recordatorios con- 
sistian en exposiciones a los Els (sucrosa para las ratas reforzadas con sucrosa, y 
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Figura 11.15.—Vista superior del 
laberinto Lashieg II usado por 
Miller (1982). S, caja de salida; 
M, caja de meta. Las paredes y 
las divisorias del laberinto esta- 
ban hechas de madera. 


descarga para las ratas con escape de descarga) en una o 
rente del laberinto. Los sujetos de control eran colocados en el mismo lugar donde 
se realizaban estos tratamientos, pero sin ser sometidos a ellos. 
En la figura 11.16 se resumen los resultados del experimento. Tanto a A 

raras reforzadas con sucrosa como a las reforzadas Con el escape de la descarga, a 
exposición al El solo en una cámara claramente diferente, des pués de e ia 
3 y 4, facilitó significativamente su rendimiento en el OS complejo. Los 
animales que habían recibido tratamientos recordatorios daban por ones 
medio menos giros equivocados en el laberinto que los animales que simp a 
eran trasladados sin verse expuestos al El solo. Este efecto facilitador e los 
recordatorios es difícil de explicar en términos de un nuevo aprendizaje pio 
las exposiciones al El solo se hicieron en una cámara claramente diferente de 
laberinto. Los sujetos no podían haber aprendido a dar los giros correctos en aa 
otro aparato. El efecto es también difícil de explicar en términos de E o o 
de motivación producido por los tratamiertos con el El solo, porque cada recorda- 
torio se administraba 24 horas antes del siguiente ensayo de entrenamiento. 
Además, Miller (1982) ha demostrado efectos similares con la exposición a la caja 
de salida del laberinto como tratamiento recordatorio, algo que, presumiblemente, 
no aumenta la motivación. Los hallazgos de Miller sugieren que las ne de 
aprendizaje características reflejan no sólo la adquisición de una e in rd 
ción, sino también una mejora en la forma en que se recupera la informaci e 
Evidentemente, los ensayos de entrenamiento funcionan en parte proporcionando 


práctica de recuperación. 


Teoría del repaso. Allan Wagner y sus colaboradores han realizado uno a 
los esfuerzos más sistemáticos para integrar el estudio de la memoria EE . 
estudio del aprendizaje, que ha dado como resultado un modelo a 
memoria, del condicionamiento y de la habituación, conocido como teo i e 
reparo (Wagner, 1976, 1978, 1979; véase también Wagner, 1981, para una elabo- 
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Figura 11.16.—Precisión en el 
recorrido de un laberinto Lash- 
ley 1 para los grupos de control 
y recordatorio reforzados con 
huida de una descarga o sucrosa. 
Los sujetos del grupo recordato- 
rio fueron expuestos al reforza- 
dor (sucrosa o descarga) en una 
cámara apreciablemente distinta 

después del ensayo 3 y del ensa- 
| t yo 4. (Según Miller, 1982.) 
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ración y una especificación mayor de los conceptos en forma de modelo matemá- 
tico detallado). 

La teoría del repaso acepta la suposición común de que existen dos tipos de 
memoria, de corto plazo y de largo plazo. Se supone que la memoria de corto 
plazo (abreviado MCP) posee una capacidad limitada, de forma que la presenta- 
ción de un estímulo nuevo puede interferir con el procesamiento de otros hechos 
de la MCP. Por el contrario, se supone que la capacidad de la memoria de largo 
plazo es mucho mayor y nunca se sobrepasa en los experimentos corrientes. Se 
supone que todos los estímulos a los que el sujeto está expuesto forman parte en 
primer lugar de la memoria de corto plazo. A partir de ahí, la información puede 
simplemente perderse con el paso del tiempo o, sí un estímulo se asocia con otro 
estímulo, la información aprendida se almacena en la memoria de largo plazo. Se 
considera que el grado de influencia que esta inforrnación de la memoria de corto 
plazo tiene sobre la conducta del sujeto, depende de hasta qué punto la informa- 
ción se «repasa». Podemos pensar en el repaso como un medio de mantener la 
memoria en estado activo. Cuanto más intensamente se repase un estimulo, más 
probabilidad existe de que influya en la conducta inmediata del sujeto (que provo- 
que alguna respuesta). El repaso es también importante en el condicionamiento y 
en la transferencia de información en la memoria de largo plazo. Se supone que 
dos estímulos (un EC y un El, por ejemplo) se asocian uno con otro hasta el 
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punto de que se repasan simultáneamente en la memoria de corto plazo, Una vez 
establecida la asociación entre el EC y el E, la presentación del EC da como 
resultado una recuperación de la memoria del El desde la memoria de largo plazo 
a la de corto plazo. Así pues, los sujetos se «acuerdan» del El cuando experimen- 
tan el EC después de que ha tenido lugar el condicionamiento. 

El concepto de repaso desempeña un papel teórico esencial. Otro importante 
concepto es el de carga. Se dice que un estímulo está cargado en la memoria a 
corto plazo si ya ha sido repasado. Existen dos maneras en las que un estímulo 
puede ser repasado en la MCP. En primer lugar, puede ser repasado porque fue 
presentado recientemente. Esta forma de cargar se llama carga autogenerada: el 
estímulo se carga gracias a una anterior presentación de sí mismo. La segunda 
forma en que un estímulo puede llegar a cargarse en la MLP es que el estímulo se 
recupere de la memoria a largo plazo a través de un estímulo asociado (tal como 
un EC). Por ejemplo, un El puede cargarse en la MCP mediante la presentación 
de un EC que estaba asociado con el El. Esta forma de cargar se llama carga 
generada por recuperación. Este lenguaje técnico puede resultar un poco engo- 
rroso. Sin embargo, las ideas que se esconden debajo no son muy complejas. Si 
pensamos activamente en un estímulo, podemos decir que nos estamos «car- 
gando». Puede que pensemos en un estímulo porque nos fue presentado recien- 
temente (carga autogenerada), o porque mos expusimos a otro hecho que nos 
recordó el estímulo (carga generada por recuperación). 

Una vez alcanzado este punto ya estamos en disposición de considerar el 
aspecto más importante de la teoría del repaso: la relación entre carga y repaso. 
El supuesto esencial de la teoría (la característica que conduce a las más intere- 
santes de sus conclusiones) es que la carga de un estímulo en la MCP imterfiere 
con el repaso del mismo provocado por una nueva presentación de ese estímulo. 
Así pues, un hecho no se repasa muchas veces si ese mismo estímulo se presentó 
en un pasado reciente (carga autogenerada), o si un estímulo asociado se presentó 
recientemente (carga generada por recuperación). El supuesto de que la carga 
bloquea el repaso tiene implicaciones importantes, tanto para las respuestas des- 
encadenadas por un estímulo como para el nuevo aprendizaje que puede ser pro- 
vocado por un estímulo. Recuérdese que del grado en que un estímulo es repasado 
depende el grado en que el estimulo influye sobre la conducta de un sujeto, o lleva 
a un nuevo aprendizaje. Dado que la carga altera el repaso, la carga de un estí- 
mulo en la MCP reduce la capacidad del estímulo para provocar respuestas o para 
intervenir en un nuevo aprendizaje. Esas implicaciones de la teoría del repaso 
son compatibles con muchos hallazgos sobre la habituación y el condiciona- 
miento. Á continuación, vamos a describir algunos de los más importantes. 


Los fenómenos de carga y de habituación. Como ya advertimos en el capítulo 
2, las presentaciones repetidas de un estimulo dan, a menudo, como resultado, 
una reducción de las respuestas al estímulo por parte del sujeto. Existen dos tipos 
de efectos de habituación. Uno es un decremento en la reactividad al estímulo, del 
cual el sujeto se recupera espontáneamente si durante un tiempo no se expone al 
estímulo. El segundo tipo de habituación tiene un efecto de mucha más larga 
duración y no se disipa con un período de descanso. Ambos fenómenos se corres- 
ponden con la teoría del repaso. La pérdida temporal de disposición para la res- 
puesta ante un estímulo puede explicarse en términos de carga autogenerada (por 
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ejemplo, Whitlow, 1975). Cada presentación de ese estímulo hace que se cargue 
en la memoria de corto plazo por un período limitado. Si el hecho sucede de 
nuevo mientras el sujeto está repasando todavía la presentación del estímulo 
anterior, el sujeto no repasa la nueva aparición del estímulo y, por tanto, no 
reacciona ante él. Este descenso en la reactividad se disipa con el tiempo, a 
medida que el sujeto termina de repasar las presentaciones previas del estímulo. 
Así pues, los descensos en la respuesta debidos a una carga autogenerada irán 
seguidos de una recuperación espontánea. 

Los efectos de la habituación a largo plazo se explican en términos de carga 
generada por recuperación. La idea es que, si en una situación concreta un estí- 
mulo de prueba se presenta repetidamente, se establece una asociación entre las 
claves de fondo de la situación y el estímulo de prueba. A causa de esta asociación, 
el sujeto se «acuerda» del estímulo de prueba siempre que esté en la situación 
experimental. Así pues, el estímulo de prueba se carga mediante un proceso de 
carga generada por recuperación. Esta carga generada por recuperación reduce la 
capacidad del sujeto para repasar los estímulos que se presentan durante la 
prueba, y por tanto, reduce la capacidad de que el sujeto reaccione a ellos. Una 
implicación interesante de esta interpretación es que el descenso en la disposición 
a responder debería anularse extinguiendo la asociación entre las claves de fondo 
de la situación experimental y el estímulo de prueba. Esto puede lograrse, sim- 
plemente, dejando al sujeto en la situación experimental durante un período largo 
de tiempo sin presentar estímulos de prueba. Después de una experiencia de 
extinción de esta clase, las claves de fondo de la situación ya mo deberían de 
«recordarle» al sujeto los estímulos de prueba, y por tanto, no deberían de produ- 
cir carga generada por recuperación. Confirmando tal predicción de resultados, 
Whitlow y Pfautz (informe de Wagner, 1976) hallaron que un período de des- 
canso sin presentación de estímulos en la cámara experimental daba como resul- 
tado una recuperación de la habituación a largo plazo. 


Carga y condicionamiento clásico. La afirmación de que la carga interfiere 
con el grado normal de repaso que provoca un estímulo tiene también implica- 
ciones interesantes para el condicionamiento clásico. La teoría del repaso sostiene 
que se establece una asociación entre el EC y el El hasta el punto de que los dos 
estímulos son repasados simultáneamente en la MCP. Este repaso simultáneo 
puede alterarse si el EC o el El se cargan en la MCP antes del ensayo de condicio- 


namiento. Un modo de lograr esto es presentar el EC o el El solos poco antes del 


ensayo de condicionamiento. Este episodio de preexposición al EC o al El produ- 
ciría una carga autogenerada del EC o del El, respectivamente, e interferiría con 
el establecimiento de la asociación EC-ElL Confirmando esta predicción, varias 
investigaciones han demostrado que la presentación del EC o del El solos poco 
antes del ensayo de condicionamiento interfiere con el condicionamiento (por 
ejemplo, Best y Gemberling, 1977; Domjan y Best, 1977; Terry, 1976). 

Otro modo de alterar el condicionamiento mediante la carga del EC o del El 
antes del ensayo de condicionamiento implica carga generada por recuperación. 
La carga generada por recuperación del estímulo condicionado se puede lograr 
presentando un estímulo que hubiera estado asociado previamente con el El De 
esta forma, la exposición a un estímulo previamente condicionado debería blo- 
quear la formación de una asociación entre un nuevo EC y el El. Como ya discu- 
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timos en el capítulo 4, este resultado, conocido como efecto de bloqueo, se ha 
demostrado en muchos experimentos de condicionamiento. La carga generada por 
recuperación del EC puede lograrse mediante mecanismos que ya hemos discutido 
antes en relación con los efectos de la habituación a largo plazo. Las presentacio- 
nes repetidas del EC (sin el El) en una situación experimental deberían establecer 
una asociación entre el EC y los estímulos de fondo de la situación. Esas claves de 
fondo de la situación cargan entonces la memoria del EC en la MCP, y esto 
interfiere con el establecimiento de una nueva asociación entre el EC y un El 
Wagner, Pfautz y Donegan (informe de Wagner, 1979) han obtenido pruebas que 
apoyan esta predicción, tanto en el condicionamiento del párpado en los conejos 
como en el condicionamiento del miedo en las ratas. 


COMENTARIOS FINALES 


En los últimos años hemos aprendido mucho sobre los mecanismos de la 
memoria animal. Se han desarrollado varias técnicas de laboratorio muy eficaces 
para el estudio de la memoria de trabajo en los animales, y se han aportado 
pruebas de la importancia de la memoria de trabajo en la historia natural de 
varias especies. Otros estudios han mostrado que la memoria puede ser alterada 
por hechos que preceden o siguen a la información principal mediante claves de 
olvido y mediante ciertos tratamientos neurofisiológicos. Sin embargo, en muchos 
casos, los fallos en la memoria pueden aliviarse a través de la exposición a algu- 
nos de los estímulos que se presentaron durante la adquisición original de la 
información. Nuestro creciente conocimiento de los mecanismos de la memoria 
animal ha resultado estimulante para estudiar las distintas formas en que los 
mecanismos de memoria intervienen en los procesos y fenómenos de aprendizaje. 


Capítulo 12 


LA COGNICIÓN ANIMAL: MECANISMOS DIVERSOS 
DE PROCESAMIENTO DE LA INFORMACION 


En el capítulo 12 se describirán distintas áreas de la investigación contempo- 
ránea sobre cognición animal en las que interviene el procesamiento de diferentes 
tipos de información. Después vamos a comenzar una discusión sobre el proce- 
samiento de la información temporal y de la numeración. Vamos a discutir des- 
pués el procesamiento de la información de pautas seriales, el aprendizaje de 
conceptos, el razonamiento en los primates y el adiestramiento del lenguaje en 
primates. El capítulo termina describiendo las aplicaciones de los procedimientos 
de adiestramiento del lenguaje a niños con deficiencias verbales. 


MEDICION DEL TIEMPO Y NUMERACION 
Técnicas para medir la conducta de medición del tiempo 
Características del reloj interno 
Un modelo de medición del tiempo 
La relación entre medición del tiempo y numeración 
EL APRENDIZAJE DE PAUTAS SERIALES 
Implicaciones del aprendizaje de pautas seriales 
Alternativas al aprendizaje de pautas seriales 
LA FORMACION DE CONCEPTOS EN LOS ANIMALES 
EL RAZONAMIENTO INFERENCIAL Y EL ANALOGICO 
El razonamiento imferencial transitivo 
El razonamiento analógico 
LA ENSEÑANZA DEL LENGUAJE A LOS CHIMPANCES 
LA APLICACION DEL ENTRENAMIENTO DEL LENGUAJE A NIÑOS 
DEFICIENTES VERBALES 





Los distintos aspectos de la conducta que vamos a discutir en este capítulo (la 
medición del tiempo, la numeración, el aprendizaje de pautas seriales, la forma- 
ción de conceptos, el razonamiento y el aprendizaje del lenguaje) poseen aparen- 
temente más diferencias que semejanzas entre ellos. No todos reflejan un meca- 
nismo común subyacente, ni todos intervienen en la solución de un problema 
comportamental común o de un mismo desafío a la supervivencia. Sin embargo, 
todos implican principios de la cognición animal que han despertado un gran 
interés en los investigadores contemporáneos. Este interés surge, en parte, por- 

e hasta hace poco se consideraba que esos procesos cognitivos estaban asociados 
principalmente a la conducta humana. El interés se debe también a los diversos 
grados de controversia que han levantado cada una de esas áreas de investigación. 
Las controversias se han centrado en si se debían postular procesos cognitivos 
complejos para explicar las distintas conductas observadas. Los que se oponen a 
las interpretaciones cognitivas han argumentado que los fenómenos implicados 
en la medición del tiempo, la numeración, el aprendizaje de pautas seriales, o en 
la formación de conceptos, el razonamiento y el aprendizaje del lenguaje, podían 
explicarse utilizando los principios tradicionales de aprendizaje. 

Por el contrario, los que abogan por interpretaciones cognitivas han argumen- 
tado que los mecanismos cognitivos ofrecen explicaciones más simples de los 
fenómenos y son más productivos al estimular nuevas investigaciones. Los traba- 
jos sobre cognición animal han confirmado ampliamente esta última justificación. 
Sin una perspectiva cognitiva, nunca se habrían realizado muchas de las investi- 
gaciones que vamos a describir en este capítulo, y muchos de los fenómenos no 
habrían sido nunca descubiertos. 


MEDICION DEL TIEMPO Y NUMERACION 


El interés por saber si los animales pueden calcular el paso del tiempo y 
contar tiene una larga historia repleta de entretenidas anécdotas. Sin embargo, 
sólo recientemente se han escrutado de forma experimental esas áreas de la con- 
ducta animal (por ejemplo, Church, 1978; Davis y Memmott, 1982). Meck y 
Church (1983) han sugerido unas definiciones simples de las acciones de medi- 
ción del tiempo y numeración: se dice que los animales están cronometrando si la 
duración de un hecho les sirve de estímulo discriminativo (una clave para respon- 
der en un sentido en vez de en otro). De forma semejante, se dice que los anima- 
les cuentan si el número de hechos les sirve de estímulo discriminativo (véase 
también Davis y Memmott, 1982). Aunque estas definiciones son sumamente 
simples, su aplicación experimental puede resultar difícil. Un requisito metodoló- 
gico esencial en la investigación sobre los fenómenos de medición del tiempo y de 


numeración consiste en asegurarse de que no existen otros hechos ambientales ' 


A a 


A 
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correlacionados con la duración (en el caso de la medición del tiempo) o el 
número (en este caso de la acción de numerar). La prueba se tiene que diseñar 
cuidadosamente para eliminar aquellos estímulos correlacionados que pudieran 
«confundir» de forma inadvertida al sujeto, permitiéndole responder correcta- 
mente sin utilizar ningún tipo de proceso interno que requiera numerar o medir 
el tiempo. Eliminar las claves correlacionadas con la medición del tiempo resulta 
más fácil que con la numeración. En primer lugar, vamos a describir las investiga- 
ciones sobre medición del tiempo y, a continuación, vamos a describir el modelo 
que considera la medición del tiempo como una variedad de la numeración. 


Técnicas para medir la conducta de medición del tiempo 


Una gran variedad de aspectos de la conducta animal reflejan una sensibilidad 
al paso del tiempo (Richelle y Lejeune, 1980), y se han utilizado diversas técnicas 
para investigar la medición del tiempo en los animales (por ejemplo, Mellgren, 
Mays y Haddad, 1983). Algunas pruebas incluyen una estimación de la duración. 
Por ejemplo, a las ratas se les puede presentar un ruido estruendoso pero inocuo 
con una duración de 5 o de 8 segundos según el ensayo, y pedírseles que den una 
respuesta discriminativa, de acuerdo con la duración de la señal Inmediatamente 
después de la presentación del ruido corto o largo se pueden insertar dos palancas 
de respuesta dentro de la cámara experimental. S1 se presentaba el ruido corto, se 
reforzaba la respuesta en la palanca izquierda con una bolita de comida; sí se 
presentaba el ruido largo, se reforzaba la respuesta en la palanca derecha con una 
bolita de comida. Las ratas son capaces de aprender sin demasiada dificultad a 
ejecutar con precisión esas tareas (por ejemplo, Church, Getty y Lerner, 1976; 
véase también Wasserman, DeLong y Larew, 1984). 

Otra técnica muy fructífera para el estudio de la medición del tiempo implica 
la determinación de la duración en vez de la estimación de la duración. Esta 
técnica, llamada procedimiento del máximo, supone una variante con ensayos 
discretos de un programa de intervalo fijo. Cada ensayo se define por la presenta- 
ción de un ruido o una luz. Transcurrido un tiempo determinado desde la apari- 
ción del estímulo en ese ensayo, se presenta una bolita de comida. Una vez pre- 
sentada la bolita de comida, el sujeto puede obtenerla presionando una palanca. 
Un reciente estudio de Roberts (1981) ilustra esta técnica de forma brillante. Se 
realizaron pruebas con ratas en una cámara estándar de presión de la palanca 
rodeada de un aislante acústico para aminorar la estimulación exterior. En unos 
ensayos se presentaba un estímulo luminoso, y en otros un ruido, La aparición de 
uno de los estímulos del ensayo señalaba que la comida se presentaría después de 
20 segundos, la aparición del otro estímulo indicaba que la comida se presentaría 
transcurridos 40 segundos. La mayoría de los ensayos finalizaban cuando el sujeto 
respondía y obtenía así la bolita de comida. Sin embargo, una pequeña proporción 
de ensayos continuaba durante un tiempo variable, nunca menor de 80 segundos, 
y terminaba sin la recompensa de comida. Estos ensayos extralargos se incluían 
para ver cómo se comportarían los sujetos una vez que ya había pasado el tiempo 
normal de reforzamiento. 

La figura 12.1 presenta los resultados del experimento en términos de tasas de 
respuesta en momentos distintos del ensayo. La figura muestra que con la señal 
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Pegsra 12,1. —Tasa de respuesta 
en función del tiempo durante 
una señal en presencia de la cual 
era servida comida después de 
20 segundos (línea continua), y 
durante una señal distinta en 
presencia de la cual la comida se 
servía tras 40 segundos (línea 
discontinua). (Según Roberts, 
1981.) 
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de 20 segundos, la tasa más alta de respuestas se producía transcurridos unos 20 
segundos del ensayo. Por el contrario, con la señal de 40 segundos, la tasa más 
alta de respuestas aparece pasados unos 40 segundos del ensayo. La increíble 
linealidad de los datos y la correspondencia entre las tasas máximas de respuesta 
y los momentos de presentación de la comida hacen que esta técnica resulte muy 
útil para el análisis de la medición del tiempo en los animales. Debería advertirse, 
sin embargo, que-esos resultados se obtuvieron sólo después de un entrenamiento 
extenso. Los datos de la figura 12.1 se obtuvieron durante cinco sesiones diarias 
de cuatro horas, después de diez sesiones de entrenamiento diarias de seis horas 
cada una. La conducta de discriminación temporal se desarrolló lentamente a lo 
largo del entrenamiento. Al principio del entrenamiento, los animales no mostra- 
ron el típico máximo de respuesta que era más tarde evidente, tal como aparece 
en la figura 12.1. 

Resultados como los que se presentan en la figura 12.1, que ilustran el control 
de la conducta que ejerce la duración del estímulo, podrían ser producto de distin- 
tos fenómenos. Una posibilidad es que la aparición de un estímulo deje una huella 
neurológica desvaneciente, cuya intensidad está en relación con el tiempo transcu- 
rrido desde la aparición del estímulo, y que el sujeto aprenda a utilizar la intensi- 
dad concreta de una huella como clave de respuesta para obtener una recompensa. 
Otra posibilidad es que el animal intervenga en algún tipo de conducta de «mar- 
cha», y la distancia recorrida se utilice, de alguna manera, para suministrar infor- 
mación sobre el paso del tiempo. Otra posibilidad más es que los animales dis- 
pongan de un reloj interno que proporcione una representación interna del 
tiempo, y «lean» este reloj para realizar el máximo de respuestas en el momento 
adecuado. 

¿Por qué deberíamos de aceptar la interpretación del reloj interno en vez de 
otras posibilidades? Church (1978) ha sugerido tres razones. La primera, la supo- 
sición de que existe un reloj interno, puede simplificar la explicación y la discu- 
sión de los casos en que la conducta se encuentra bajo control temporal. Es muy 
probable que la aplicación de otras alternativas resulte mucho más incómoda en 
una amplia gama de fenómenos de medición del tiempo. En segundo lugar, el 
concepto de reloj, seguramente, estimulará cuestiones sobre la medición del 
tiempo de los animales que, de otro modo, no se plantearían (véase más abajo). 
Por último, un reloj interno puede ser una realidad fisiológica que tenemos mayor 
probabilidad de hallar si postulamos primero su existencia e investigamos sus 
propiedades (Meck, Church y Olton, en prensa). 
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Características del reloj interno 


Si el concepto de reloj interno es útil para explicar los resultados del procedi- 
miento del máximo de respuestas y otros fenómenos de medición del tiempo, 
deberíamos ser capaces de utilizar el concepto para proponer cuestiones intere- 
santes a investigar. Podemos preguntar, por ejemplo, si se puede parar tempo- 
ralmente el reloj sin provocar una pérdida de información sobre la cantidad de 
tiempo que ha transcurrido ya. Para responder a esta pregunta, Roberts (1981; 
véase también Roberts y Church, 1978) interrumpió una señal temporal de 40 
segundos durante 10 segundos en ensayos seleccionados de la prueba. Durante los 
intervalos entre ensayos, la cámara experimental estaba a oscuras. Cada ensayo se 
marcaba con la presentación de una luz; en la mayoría de las pruebas, la comida 
se presentaba 40 segundos después de la aparición de la luz. En ensayos especiales 
de la prueba, que no tenían recompensa de comida, la luz se apagaba durante 10 
segundos una vez transcurridos 10 segundos desde el comienzo del ensayo. La 
figura 12.2 muestra la distribución de la tasa de respuesta obtenida en distintos 
momentos de los ensayos con y sin interrupción. Ál introducir una interrupción 
de 10 segundos, simplemente se produce una desviación del máximo de la tasa de 
respuesta de unos 10 segundos (13,3 seg, para ser exactos). Estos resultados 
sugieren que, con un cierto margen de error, el reloj interno deja de medir el 
tiempo cuando se produce una interrupción, concluida la cual reanudan la medi- 
ción del tiempo en vez de iniciarla desde cero. 

Otras investigaciones han mostrado que los relojes internos poseen muchas 
propiedades iguales a las del cronómetro. Los relojes internos miden la cantidad 
de tiempo transcurrido (tal como lo hace el cronómetro) más que el tiempo de 
que se dispone antes del final del intervalo (como haría un reloj de los utilizados 
en cocina —de los de cuenta atrás—). Parece que los animales utilizan un mismo 
reloj interno para medir la duración de estímulos de modalidades diferentes 
(visuales y auditivas); también utilizan el mismo reloj y la misma velocidad de 
reloj para medir los intervalos de duraciones diferentes (Meck y Church, 1982; 
Roberts, 1981, 1982; Roberts y Church, 1978). Una vez determinadas las caracte- 
rísticas básicas de la conducta de medición del tiempo en los sujetos normales, los 
investigadores han comenzado a fijar su atención en la fisiología de la medición 
del tiempo y en los efectos farmacológicos sobre ella. Por ejemplo, se ha obser- 
vado que algunas drogas, como la metanfetamina, aumentan la velocidad del reloj 


Figura 12.2.—Tasa de respuesta 
en función del tiempo, durante 
una señal en presencia de la cual 
la cornida era servida después de 
40 segundos. En algunos ensa- 
yos, la señal fue interrumpida 
durante un período de apagón 
de 10 segundos (línea disconti- 
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interno, mientras que se ha observado que otras drogas, como el haloperidol, 
disminuyen la velocidad del reloj (Maricq, Roberts y Church, 1981; Meck, 1983). 
Estos resultados pueden facilitar la comprensión de los efectos de las drogas psi- 
coactivas. Sin una investigación básica sobre los mecanismos conductuales de la 
medición del tiempo no habría comenzado la investigación acerca del modo en 
que las distintas drogas influyen en la percepción del tiempo. 


Un modelo de medición del tiempo 


Hasta ahora hemos considerado de forma poco precisa el concepto de reloj 
interno. ¿Cuáles podrían ser los detalles de un mecanismo que permite a los 
animales (y a las personas) responder en base a una información temporal? Gib- 
bon y Church (1984) han propuesto un modelo de procesamiento de la informa- 
ción para la estimación del tiempo que se presenta en el diagrama de la figura 
12.3 (véase también Gibbon, Church y Meck, 1984). El modelo sostiene la exis- 
tencia de tres procesos independientes: un proceso de memoria, un proceso de 
decisión y un reloj. El proceso de reloj se activa por el comienzo del intervalo a 
cronometrar. Se supone que la medición del tiempo se realiza mediante un mar- 
capasos que genera impulsos a un cierro ritmo (algo así como un marcapasos 
cardiaco). Los impulsos del marcapasos se trasmiten a un interruptor, que se 
enciende al comienzo del intervalo a cronometrar. Esto permite que los impulsos 
del marcapasos vayan a un acumulador que cuenta el número de impulsos que van 
llegando hasta él. Cuando finaliza el intervalo a cronometrar, el interruptor se 
cierra, bloqueando así la acumulación de más impulsos del marcapasos. De esta 
forma, el acumulador acumula la información sobre el tiempo transcurrido. Esta 
información se trasmite después a la memoria de trabajo, lo que proporciona 
nuevos datos sobre el ensayo que está teniendo lugar. Se supone que el sistema 
nervioso también posee, almacenada en su memoria de referencia, información 
sobre la duración de estímulos similares obtenida en entrenamientos anteriores. 
Los contenidos de la memoria de trabajo y de la memoria de referencia se compa- 
ran mediante un proceso de decisión, y esta comparación suministra la base para 
la respuesta del animal. Por ejemplo, en el procedimiento del máximo de respues- 


tas, si la información temporal contenida en la memoria de trabajo se ajusta a la 


información sobre la disponibilidad de la recompensa contenida en la memoria de 
referencia, se fomenta que el sujeto responda. S1 la información de la memoria de 
trabajo y la de la memoria de referencia no se ajustan lo suficiente, el animal no 
se decide a responder. Gracias a este mecanismo, el máximo en la tasa de respues- 
tas se produce en un momento próximo a la presentación de la recompensa. 
Explicar detalladamente este modelo hipotético de medición del tiempo es úcil 
porque permite un análisis más detallado de los distintos tipos de error que los 
animales pueden cometer en las tareas de medición del tiempo (véase Gibbon y 
Church, 1984). Gracias a esos análisis se explican con más detalle ciertos aspectos 
de la conducta de medición del tiempo, lo cual no sería posible de otra manera. El 
modelo también resulta útil porque indica varias formas en que puede ser alterada 
la conducta de medición del tiempo. Las pruebas más recientes, por ejemplo, 
sugieren que ciertas drogas alteran la conducta de medición del tiempo cambiando 
la velocidad del reloj interno (alterando la frecuencia de los impulsos generados 
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Figura 12.3. —Diagrama de un modelo de cronometraje procesador de la información. (Según Gibbon 
y Church, 1984.) 


por el marcapasos). Por el contrario, otras drogas cambian la conducta de medi- 
ción del tiempo alterando el proceso de la memoria, el recuerdo de la duración de 
los intervalos de tiempo anteriores (Meck, 1983). Esas influencias opuestas sobre 
la conducta de medición del tiempo serían difíciles de interpretar sin un modelo 
que distinga un proceso de reloj de un proceso de memoría. 


La relación entre medición del tiempo y numeración 


El modelo de medición del tiempo propuesto por Gibbon y Church (1984) y 
representado en la figura 12.3 puede adaptarse tanto a la acción de medición del 
tiempo como a la de numeración. Que el sistema actúe como un cronómetro O 
como un contador depende, únicamente, de la forma en que opere el interruptor 
que permite que los impulsos vayan del marcapasos al acumulador (véase figura 
12.3). En la figura 12.4 se presentan los distintos modos de operación de la cone- 
xión, que dan como resultado la medición del tiempo y la numeración. En la 
posición de cronómetro, el interruptor permanece abierto mientras el estímulo 
siga encendido, y se cierra cuando el estímulo cesa. Con esta disposición, el 
número de impulsos que llegan hasta el acumulador suministra información 
acerca del tiempo que el estímulo estuvo encendido, con independencia de las 
veces que se apagara, En la posición de contador, el interruptor se abre durante 
un tiempo breve constante cada vez que se presenta un estímulo, con indepen- 
dencia de la duración del estímulo. Con esta disposición, el número de impulsos 
que llegan hasta el acumulador refleja el número de acontecimientos estimulares, 
QA Buracióna 1 ALU UL LELICJA Cl MUNMETO ae acontecimientos estimulares, 
no su duración. 
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Figura 12.4.-—Distintos modos de operación del interrupror provocan que, utilizando la misma 
entrada y acumulador, se obtenga un cronometrador o un contador. (Según Meck y Church, 1983.) 


La discusión anterior plantea la posibilidad de que medir el tiempo y numerar 
sean en muchos sentidos acciones similares. Esta es una curiosa posibilidad que 
está despertando un interés creciente entre los investigadores. Las pruebas que se 
van acumulando sugieren que la hipótesis puede ser correcta, Una forma de valo- 
rar la semejanza entre la conducta de medición del tiempo y la de numeración 
consiste en comparar la precisión con que las ratas juzgan las diferencias de 
tiempo y la precisión con la que juzgan las diferencias numéricas. Con tal de que 
la proporción entre el período mayor y el menor sea la misma que entre el 
número mayor y el menor (8 segundos/2 segundos, comparado con 8 hechos/2 
hechos, por ejemplo), la precisión en la estimación del tiempo es notablemente 
similar a la precisión en la estimación del número. Se ha sugerido también esta 
semejanza entre el mecanismo para cronometrar y el mecanismo para numerar 
por el hecho de que la metanfetamina tiene efectos muy semejantes sobre los dos 
tipos de conducta (Meck y Church, 1983). 


EL APRENDIZAJE DE PAUTAS SERIALES 


Los estímulos ambientales rara vez se producen al azar e independiente- 
mente unos de otros. Ántes bien, muchos aspectos del ambiente actúan como 
pautas ordenadas de estimulación. La conducra de respuesta a las pautas seriales 
de estímulos ha sido extensamente investigada (por ejemplo, Jones, 1974; Restle 
y Brown, 1970; Simon y Kotovsky, 1963). Considérese, por ejemplo, qué haría- 
mos si se nos pidiera que memorizáramos la siguiente lista de números: 
1234234534564567. Podríamos aprender los números memorizando qué número 
se encontraba en cada una de las 16 posiciones de la lista. Si supiéramos que el 1 
se encontraba en la primera posición, el 2 en la segunda y quinta, el 3 en la 
tercera, sexta y novena, y así sucesivamente, podríamos recordar los números en 
el orden correcto. Sin embargo, esta forma sería la más difícil. Una estrategia 
mucho más simple sería buscar la pauta que siguen los números. Si pudiéramos 
averiguar esa pauta, tendríamos una regla que usaríamos para generar la secuen- 
cia de números. La lista de números que se dio arriba estaba generada mediante 
una regla relativamente simple, que podría definirse de la forma siguiente: se 
empieza a contar por el número 1, pero cada cuatro números se restan 2. Memo- 
rizar esa regla es mucho más fácil que aprender qué número está colocado en cada 
una de las 16 posiciones de la lista. 

Abstraer una regla a partir de una secuencia de estímulos implica responder a 
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la pauta de estímulos. Está claro que las personas responden basándose en las 
pautas inherentes a los estímulos que experimentan. ¿Pueden los animales res- 
ponder también de acuerdo con pautas cuando los estímulos se presentan de 
forma serial? Esta cuestión está despertando cada vez el interés de más investiga- 
dores (por ejemplo, Capaldi, Verry, Nawrocki y Miller, 1984; Hulse, 1978; Hulse, 
Cynx y Humpal, 1984; Straub y Terrace, 1981). 

Un analisis experimental de la forma en que los animales responden a patro- 
nes seriales de estímulos requiere, en primer lugar, la selección de estímulos efi- 
caces, Numerosas investigaciones con animales sobre el aprendizaje de patrones 
seriales han utilizado una técnica desarrollada por Stewart Hulse y sus colabora- 
dores en los que se empleaban, como estímulos, números diferentes de bolitas de 
comida. En un corredor se realizaron pruebas con ratas hambrientas que, al final 
de cada carrera, recibían un número diferente de bolitas de comida en la caja 
meta. En un experimento, por ejemplo, la caja meta podía contener 14, 7,3,100 
bolitas de comida. Los sujetos realizaban las carreras por el corredor de cinco en 
cinco. En cada serie de 5 carreras, el sujeto recibía 14 bolitas en la primera 
carrera, 7 bolitas en la segunda carrera, 3 en la tercera, 1 en la cuarta, y final- 
mente Ó en la quinta carrera. Así pues, la secuencia de estímulos que esos sujetos 
experimentaban era de 14, 7, 3, 1 y 0. La velocidad de carrera se utilizaba para 
evaluar las respuestas ante las distintas cantidades de comida. Conforme el entre- 
namiento progresaba, las ratas aprendían a ajustar su velocidad de carrera a la 
cantidad de recompensa que iban a recibir en cada carrera. En concreto, aprendían 
a correr mucho más despacio en la quinta carrera de cada serie, que terminaba en 
0 bolitas, que en las carreras anteriores, que finalizaban con 1 a 14 bolitas. Ese 
descenso en la quinta carrera no podía atribuirse a la fatiga, porque Otras invest:- 
gaciones han mostrado que las ratas no habrían disminuido la velocidad si hubie- 
ran recibido recompensa en la quinta carrera. ¿Por qué se produce el descenso? 
Hulse y sus colaboradores han propuesto una hipótesis del aprendizaje de pauta 
seriada. De acuerdo con esta intepretación, los animales aprenden a responder 
ante una serie de estímulos (como, por ejemplo, cantidades de comida en serie) 
basándose en la paura, o estructura, inherente a la serie. 


Implicaciones del aprendizaje de pautas seriales 


¿Qué clase de pauta podían las ratas haber extraído de la serie de cantidades 
de comida utilizadas en el experimento anterior?, y ¿cómo podríamos estar segu- 
ros de que estaban respondiendo de acuerdo a la pauta de los estímulos? La 
secuencia 14-7-3-1-0 posee un patrón simple y fácil de identificar: el cambio de 
una cantidad de comida a la siguiente es siempre del mismo tipo: un descenso, 
Una pauta en la que los elementos se suceden en una serie que implica cambios 
siempre en la misma dirección se llama secuencia monotónica. Una secuencia 
monotónica de estímulos tiene una pauta mucho más simple que una secuencia en 
que los elementos sucesivos no impliquen siempre el mismo tipo de cambio. Por 
ejemplo, la serie 14-1-3-7-0 es una secuencia no monotónica, porque pasar de un 
elemento al siguiente puede implicar tanto un descenso (por ejemplo, 14-1) como 
un aumento (por ejemplo, 1-3). Si las ratas responden de acuerdo con una pauta 
secuencial de cantidades de comida, entonces la simplicidad de la pauta debería 
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Monotónica 


Tiempo de carrera (seg) 





14 7 3 ] 0 
14 1 3 y 0 


Número de bolitas de comida 


Figura 12.5.—Tiempos de carrera asintóticos en cinco carreras sucesivas reforzadas mediante distinto 

número de bolitas de comida. Un grupo de raras recibió cantidades de comida que formaban una serie 

monorónica decreciente (14-7-3-1-0 bolitas). El otro grupo recibió cantidades de comida en una serte 
no monotónica (14-1-3-7-0 bolitas). (Según Hulse, 1978.) 


facilitar el aprendizaje. Esto es, deberían aprender más fácilmente secuencias 
monotónicas que secuencias no monotónicas. e 
El experimento descrito arriba también incluía un grupo de ratas que recibía 
las distintas cantidades de comida con una serie no monotonica cd -125=150) 
durante las sucesivas carreras en el corredor. La figura 12.5 muestra los tiempos 
de carrera, al final del experimento, en cada una de las 5 Carreras de la secuencia, 
para grupos de ratas entrenadas con secuencias MONotónicas (14-7-3-1-0) y con 
secuencias no monotónicas (14-1-3-7-0). Ambos grupos tardaron más tiempo en 
recorrer el pasillo durante la carrera no reforzada (quinta) de la secuencia, que 
durante las anteriores. Los resultados obtenidos también indicaban que los sujetos 
expuestos a secuencias monotónicas aprendían la secuencia decreciente con menos 
entrenamiento que los sujetos expuestos a la secuencia 00 monotónica, Además, 
como muestra la figura 12.5, los sujetos del grupo monotónico iban más despacio 
en la quinta carrera que los sujetos del grupo no monotónico. Estos Pega se 
corresponden con una interpretación por aprendizaje de la pauta seria (véase 
también Fountain, Evenson y Hulse, 1983). ns 
La conclusión más importante de la hipótesis del aprendizaje de pauta serial 
es que la respuesta del sujeto depende del tipo de pauta que siga la serie de 
estímulos. Hulse y sus colaboradores han comprobado esta predicción de diferen- 
tes maneras. Por ejemplo, Fountain y Hulse, 1981; Hulse y Dorsky, 1979). En 
estudio, por ejemplo, compararon el aprendizaje com secuencias fuerte y débil- 
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mente monotónicas de cantidades de comida, 14-7-3-1-0 y 14-5-5-1-0 (Hulse y 
Dorsky, 1977, Experimento 2). Ambas secuencias suponían un descenso en las 
cantidades de comida a lo largo de las cinco carreras. Sin embargo, la secuencia 
débilmente monotónica (14-5-5-1-0) incluía una interrupción temporal de la 
pauta descendente (tanto la segunda como la tercera carrera fueron reforzadas 
con 5 bolitas). La secuencia fuertemente monotónica poseía una pauta más fácil 
de discernir. Si las ratas responden basándose en la pauta de reforzamiento, 
debemos esperar un rendimiento más apropiado con la secuencia fuertemente 
monotónica que con la secuencia débilmente monotónica. Los resultados confir- 
maron esta predicción. 

En otro estudio, se manipuló la dificultad de aprendizaje de la pauta de una 
secuencia larga introduciendo claves divisorias (Fountain, Henne y Pulse, 1984). 
La investigación con sujetos humanos ha demostrado que el aprendizaje de una 
secuencia larga se facilita subdividiendo la secuencia en unidades más pequeñas 
que poseen su propia estructura interna consistente. (Este proceso se llama a 
veces fragmentación.) Por ejemplo, los números 214325436547 son dificiles de 
memorizar de esta forma. La tarea se facilita mucho si se agrupan los números 
asi: 214 325 436 547. En este caso, los espacios entre los tríos sucesivos de núme- 
ros actúan como claves divisorias que fragmentan la serie completa en cuatro 
agrupaciones más pequeñas. Las claves divisorias facilitan el aprendizaje sólo si 
rompen la serie en unidades que tienen su propia estructura interna. $1 las claves 
divisorias se colocan en puntos inapropiados de la serie, pueden no ayudar en 
absoluto, o incluso pueden dificultar el aprendizaje, porque hacen confusa la pauta 
de la serie. Por ejemplo, la pauta de la serie anterior sería más confusa si se 
dividiera así: 2143 2543 6347. 

Fountain y otros (1984) realizaron pruebas con ratas en un laberinto en T en 
las que se utilizaron como estímulos distintas cantidades de comida, que formaban 
una pauta serial En cada carrera solamente se abría un brazo del laberinto. Cada 
rata recibía las recompensas 14-7-3-1-0 cinco veces al día. Así pues, la serie total 
de cantidades de comida consistía en 25 elementos, resultado de las cinco repeti- 


ciones de la secuencia 14-7-3-1-0. Con un grupo de ratas (grupo N), no se utiliza- 


ron claves divisorias; los sujetos realizaron 25 carreras consecutivas que acababan 
siempre en la misma caja meta, y no se señalaban de ninguna forma las distintas 
repeticiones de la secuencia en un mismo día. Con un segundo grupo (grupo E), sí 
se introducían claves divisorias: después de que las ratas completaran la subse- 
cuencia —esto es, después de cada carrera con un premio de O bolitas— se cam- 
biaba el brazo del laberinto en T utilizado como caja meta. Las claves divisorias se 
suministraban durante los Y primeros días del experimento y se suprimían 
cuando los sujetos pasaban por la prueba el 8. día. 

La figura 12.6 resume los resultados del experimento, presentando los tiern- 
pos de carrera según los distintos números de bolitas de comida, los días 7.* y 8.* 
para el grupo E y el 8.” día para el grupo N. El grupo N (que no recibió ninguna 
clave divisoria) corrió con la misma rapidez para todas las cantidades de comida, 
incluyendo las de O bolitas, el día 8.?. Esto indica que, sin dividir la serie, el sujeto 
no aprendía a responder adecuadamente a las distintas cantidades de comida en 
los ocho días de entrenamiento, pues no iba más lento en las carreras con cero 
bolitas. Por el contrario, el grupo E, que recibía un estímulo divisorio durante el 
entrenamiento, distribuía muy bien sus esfuerzos el 7.2 día, cuando la fragmenta- 
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Figura 12.6.—Tiempos de carre- 
rá en cinco carreras sucesivas re- 
forzadas con distinto número de 
bolitas de comida. La curva N-8 
fue obtenida el 82 día con sujeros 
a los que nunca se les había 
suministrado claves divisorias en- 
tre las repeticiones de la secuen- 
cia de cinco carreras. Las curvas 
E-7 y E-8 se obtuvieron con su- 
jetos adiestrados mediante cla- 
ves divisorias. Estas se presenta- 
ron el día 7 (curva E-7) pero no 
el día 8 (curva E-8). Este expe- 
rimento se realizó con ratas. (Se- 
gún Fountain, Henne y Hulse, 


N.? de bolitas de comida 1984.) 


Tiempo de carrera (seg) 





ción todavía estaba siendo utilizada; los sujetos del grupo E corrían mucho más 
despacio en las carreras con cero bolitas que en las otras carreras. Los sujetos 
seguían respondiendo a la secuencia (aunque no tan bien) cuando se suprimía el 
estímulo divisorio el 8.2 día, lo que indicaba que algo de lo que habían aprendido 
sobre la paura persistía aun en ausencia de división. Esos resultados confirman la 
interpretación de que los animales pueden responder de acuerdo con la estructura 
formal de una pauta serial. 

Los resultados que se presentan en la figura 12.6 sobre el grupo N merecen 
un comentarío adicional. ¿Por qué actuaron esos sujetos tan mal? Después de 
todo, ellos recibían la misma secuencia fuertemente monotónica (14-7-3-1-0), que 
previamente habíamos descrito como productora de un buen seguimiento de la 
pauta serial (véase figura 12.5). Probablemente, fueron dos los factores responsa- 
bles de esta diferencia. El grupo monotónico del primer estudio recibía una clave 
divisoria cuando completaba la serie de 14-7-3-1-0 en la forma de un intervalo de 
tiempo amplio antes de ser colocado de nuevo en el corredor para la siguiente 
serie de cinco carreras. Las investigaciones han demostrado que un intervalo 
amplio entre carreras puede resultar una eficaz clave divisoria (Fountain y Otros, 
1984). Además, los datos del grupo monotónico de la figura 12.5 se obtuvieron 
después de un entrenamiento más extenso que los datos del grupo N de la figura 
12.6. El grupo N también aprendió finalmente la pauta serial, pero no lo hizo 
hasta el día 13 del entrenamiento. 


Alternativas al aprendizaje de pautas seriales 


Los experimentos que hemos descrito pueden también analizarse utilizando 
conceptos teóricos que no suponen el aprendizaje de pautas (véase Hilse y 
Dorsky, 1977, 1979). El punto de vista alternativo más destacado se basa en las 
asociaciones secuenciales, y sostiene que el aprendizaje de una lista de elementos 
implica la formación de asociaciones entre pares sucesivos de elementos (Capaldi 
y Molina, 1979; Capaldi, Nawrocki y Verry, 1982; Capaldi, Verry y Davidson, 
1980). Al hablar de extinción en el capítulo 5, ya discutimos una aplicación de 
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esta teoría para la conducta instrumental. Esta teoría afirma que el sujeto puede 
recordar durante largos intervalos la recompensa obtenida en la carrera anterior. 
Se supone entonces que esta memoria se asocia con el resultado de la carrera 
siguiente. Que el recuerdo del resultado anterior estimule (o inhiba) la respuesta 

instrumental, depende de que se haya asociado con el reforzamiento (o con el no 
reforzamiento). Constidérese, por ejemplo, la secuencia 14-7-3-1-0. En esta se- 
cuencia, los sujetos son reforzados por responder (en la segunda carrera) cuando 
recuerdan haber recibido 14 bolitas en la carrera anterior (El4). También se les 
refuerza por responder (en las carreras tercera y cuarta) cuando recuerdan haber 
recibido 7 y 3 bolitas en las carreras anteriores (E7 y E3), respectivamente. Así 
pues, los recuerdos Elá4, E7 y E3 se convierten en estímulos discríminativos posi- 
tivos (EC) para la respuesta instrumental. En contraposición con las primeras 
cuatro carreras (en que los sujetos son reforzados), no se les refuerza en la quinta 
carrera, después de recibir 1 bolita de recompensa en la cuarta carrera. Por tanto, 
el recuerdo de haber recibido una bolita en el ensayo anterior (El) se convierte en 
un estímulo discriminativo negativo (E —) para la respuesta instrumental. De 
acuerdo con este análisis, los animales responden lentamente en la quinta carrera 
porque la memoria de 1 bolita de la carrera anterior actúa de E —. 

Corroborando la teoría de la asociación secuencial, las ratas han mostrado 
tener una notable capacidad para recordar el resultado, ya sea de recompensa o de 
no recompensa, de las carreras anteriores. Pueden recordar, por ejemplo, hasta 
ocho hechos separados (una recompensa seguida de siete no recompensas) 
(Capaldi y Verry, 1981). La teoría de la asociación secuencial ha logrado un éxito 
sorprendente en la explicación de algunos resultados que, a primera vista, se 
podían únicamente predecir mediante la hipótesis del aprendizaje de pautas. Con- 
sidérense, por ejemplo, los efectos de la división sobre el aprendizaje de pautas. 
Como ya describimos anteriormente, cuando la subsecuencia de cantidades de 
comida 14-7-3-1-0 se repite cinco veces cada día sin interrupción, el seguimiento 
de la pauta se consigue mejor si la terminación de la subsecuencia está marcada 
por una clave divisoria. La hipótesis del aprendizaje de la pauta predice, clara- 
mente, este resultado porque las claves divisorias que marcan las subsecuencias 
hacen mucho más fácil discernir la estructura. Capaldi, Verry, Nawrocki y Miller 
(1984) han sugerido una interpretación alternativa. Si la secuencia 14-7-3-1-0 se 
repite una y otra vez sin claves divisorias, la carrera con O bolitas va seguida de 
una carrera con 14 bolitas. Por tanto, la memoria de no recompensa (E0) se 
presenta cuando el sujeto recibe 14 bolitas, convirtiendo al E0 en un estímulo 
discriminativo para la carrera. El recuerdo de O bolitas es similar al recuerdo de 1 
bolita (E1). Por tanto, se supone que las propiedades discriminativas de E0 se 
generalizan a El. Esto anima a los sujetos a responder rápidamente en la carrera 
siguiente a la de la recompensa de 1 bolita. El resultado es que el sujeto no va más 
despacio en la carrera de O bolitas de la secuencia 14-7-3-1-0, y no se observa un 
seguimiento adecuado de la pauta. 

¿Cómo podrían las claves divisorias reducir las propiedades discriminativas 
del El y disminutr la velocidad en la carrera de O bolitas de la secuencia 14-7-3-1- 
0? Capaldi, Verry, Nawrocki y Miller (1984) sugieren que esto ocurre porque las 
claves divisorias se asocian con la recompensa que les sigue. Considérese la intro- 
ducción de claves divisortas «X» entre las repeticiones de una secuencia, tal como 
sigue: X-14-7-3-1-0-X-14-7-3-1-0 y así sucesivamente. Ahora la recompensa de 
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14 bolitas ya no se da después de la recompensa de 0 bolitas, sino después de las 
claves divisorias simbolizadas con una «X». Por tanto, es el recuerdo de «X», más 
que el recuerdo de la recompensa de O bolitas, lo que se asociará con la recom- 
pensa de 14 bolitas. «X» bloqueará la asociación del E0 con la recompensa de 14 
bolitas porque «X» es un predictor mejor de las 14 bolitas. Ya que en este caso, 
E0 no se convierte en un estímulo discriminativo para la carrera, no se produce la 
generalización del control discriminativo de E0 a El. El resultado es que el sujeto 
no se anima a responder en la carrera de 0 bolitas como respuesta al recuerdo de 
una recompensa de 1 bolita, emergiendo así el efecto de disminución de la veloci- 
dad en las carreras de O bolitas. De acuerdo con este análisis, las claves divisorias 
actúan no sólo clarificando la organización estrucmiral de la secuencia de cantida- 
des de comida, sino impidiendo la adquisición del control discriminativo por parte 
de estímulos que, de otro modo, llevarían a dar respuestas en carreras con O 
bolitas. 

El ingenioso análisis teórico y experimental del efecto divisorio que nos sumi- 
nistran Capaldi, Verri, Nawrocki y Miller (1984) hace evidente que la teoría de la 
asociación secuencial tiene que considerarse una alternativa seria a la hipótesis del 
aprendizaje de pautas seriales. Sin embargo, probablemente, la teoría no explique 
todos los resultados obtenidos con los patrones seriales. Por ejemplo, como han 
advertido Capaldi y sus colaboradores (véase Capaldi y Molina, 1979), la teoría de 
la asociación secuencial no puede explicar la diferencia, descrita anteriormente, 
entre una secuencia monotónica fuerte (14-7-3-1-0) y una débil (14-5-5-1-0). Se 
produce un seguimiento significativamente mejor de la secuencia monotónica 
fuerte que de la débil. En ambas secuencias sería de esperar que el recuerdo de 
una recompensa de 1 bolita (El) se convirtiera en un estímulo discriminativo 
negativo, porque la carrera después de la recompensa de 1 bolita finaliza con 0 
bolitas. En la secuencia fuerte (14-7-3-1-0), el estímulo discriminativo positivo 
más parecido es el recuerdo de 3 bolitas (E3). Por el contrario, en la secuencia 
monotónica débil (14-5-5-1-0), el estímulo discriminativo positivo más parecido 
es el recuerdo de 5 bolitas (E5). Debería producirse una generalización del estí- 
mulo mayor de E3 a El que de ES a El. Por tanto, El debería ser menos eficaz 
para inhibir la carrera en la secuencia rmonotónica fuerte (14-7-3-1-0) que en la 
secuencia monotónica débil (14-5-5-1-0). El hecho de que se observara el resul- 
tado opuesto contradice esta predicción. : 

Aunque la teoría de la asociación secuencial no ha sido capaz de explicar ade- 
cuadamente ciertos resultados de las pautas, ha logrado explicar otros resultados. 
Capaldi y Molina (1979), por ejemplo, han demostrado que, en algunas secuencias 
de recompensas, la capacidad discriminativa del recuerdo de los resultados de 
respuestas anteriores es más importante para predecir la conducta que la pauta 
estructural de las secuencias. Existen pruebas que apoyan tanto la hipótesis del 
aprendizaje de pautas como la teoría de la asociación secuencial. Aunque la hipó- 
tesis del aprendizaje de pautas no ha soportado todos los desafíos, ha logrado 
estimular investigaciones que, de otra manera, probablemente no se habrían 
realizado (como la de los efectos de las claves divisorias). La tarea para los futuros 
investigadores consiste en delimitar más claramente en qué circunstancias pre- 
dominan las asociaciones secuenciales y en cuáles la estructura de pautas para el 
control de la conducta (Roitblar, Pologe y Scopatz, 1983). 
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Los organismos experimentan una gran variedad de estímulos a lo largo de su 
vida. Sin embargo, como ya hemos visto, a menudo no responden a esos estímu- 
los como si fueran estímulos independientes y aislados. En la sección anterior 
hemos discutido una forma de organización perceptmal, las respuestas a una serie 
de estímulos de acuerdo al patrón estructural de la serie. Las reacciones ante los 
estímulos pueden también organizarse en clases, o categorías, a las que el esti- 
mulo individual pudiera pertenecer. Considérese, por ejemplo, el hecho de ver 
una silla. Podemos advertir algunas de sus características específicas, como color, 
forma, peso, firmeza y materiales. Sin embargo podemos advertir también que es 
un ejemplo de la categoría «silla». Podemos estar de acuerdo acerca de qué cosas 
son sillas y qué cosas no. Resulta mucho más difícil especificar las características 
esenciales que constituyen el concepto «silla». Muchas sillas son marrones, tienen 
cuatro patas, tienen un asiento a la altura de las rodillas, son duras y de madera. 
Sin embargo, en ocasiones puede haber una silla que no tenga ninguna de esas 
características. Áunque no se entiende bien la forma en que los seres humanos 
forman los conceptos, no existe ninguna duda de que los conceptos son muy 
importantes para la conducta humana. Poseemos conceptos de entidades físicas, 
tales como las sillas, las casas, los árboles, el agua, los gatos y los perros. También 
poseemos conceptos de hechos como una tormenta o una pelea, y conceptos abs- 
tractos, tales como la lealtad, la justicia y la inteligencia. Uno de los motivos de 
que los conceptos sean tan importantes para la conducta humana es que forman 
los bloques de construcción del lenguaje. Las palabras, en gran parte, son etique- 
tas de los conceptos. 

Dado que los conceptos complejos son esenciales para el lenguaje, el estudio 
de la formación de conceptos en los animales ha constituido parte esencial de los 
esfuerzos por enseñar habilidades lingúísticas a los animales (por ejemplo, D. 
Premack, 1976). Gran parte de esta investigación se ha llevado a cabo con chim- 
pancés. No existe ninguna duda de que los chimpancés son capaces de aprender 
conceptos complejos. Sin embargo, los chimpancés tienen el sistema nervioso 
mucho más desarrollado que la mayoría de los animales. Por tanto, bien podría- 
mos preguntarnos si un organismo tal como la paloma, con un cerebro más rudi- 
mentario, es también capaz de responder en base a conceptos. En el capítulo 11 
discutimos brevemente el aprendizaje del concepto «lo mismo que» en relación 
con algunas interpretaciones de la conducta de ajuste a la muestra (véase «El 
aprendizaje de regla específica frente al de regla general»). En la presente sección 
vamos a concretar la forma en que las palomas aprenden conceptos perceptuales: 
conceptos que intervienen en el reconocimiento de objetos como un árbol, de una 

masa de agua o una persona (véase Cerella, 1982; Herrnstein, 1984; Lea, 1984, 
para revisiones recientes de la investigación y de la teoría en este área). 

Herrnstein, Loveland y Cable (1976) llevaron a cabo uno de los análisis más 
completos de la formación de conceptos en los animales. Investigaron la capaci- 
dad de las palomas para responder a ejemplos de tres conceptos: árbol, agua y una 
persona concreta, basándose en una foto en dos dimensiones que ilustra esos 
conceptos. Su método consistía, básicamente, en un entrenamiento discriminativo. 
En el experimento del «árbol», por ejemplo, se proyectaron en la pared de la 
cámara experimental, cerca de una tecla de respuesta, diapositivas con paisajes 





PRINCIPIOS DE APRENDIZAJE Y DE CONDUCTA 463 


diversos. Si el paisaje contenía un árbol o alguna parte de un árbol, las palomas 
eran reforzadas con comida por picotear la tecla. Si el paisaje no contenía un 
árbol ni una parte de un árbol, el picoteo no se reforzaba. Cada sesión experimen- 
tal consistía en 80 presentaciones de diapositivas, unas cuarenta de las cuales 
incluían un árbol Durante el entrenamiento, los estímulos para cada día eran 
seleccionados al azar entre 400-700 fotografías que representaban diversas esce- 
nas de las cuatro estaciones del año en Nueva Inglaterra. Los estímulos que se 
reforzaban incluían árboles (o partes de árboles) de todas las clases, Sin embar O 
los árboles no eran, necesariamente, el punto principal de interés en las fotos 
Algunas diapositivas mostraban un árbol en la lejanía, otras mostraban árboles 
que estaban en parte ocultos de forma que, por ejemplo, sólo algunas ramas eran 
visibles. 
| Durante el entrenamiento, sólo ocasionalmente se utilizaba la misma fotogra- 
fía más de una vez. Los sujetos aprendían enseguida lo que se les pedía en la 
prueba y picoteaban la tecla con una tasa mucho más alta en presencia de fotogra- 
fías que contenían un árbol que en presencia de fotografías sin árboles. ¿A qué era 
debida la precisión en el rendimiento? Una posibilidad es que las palomas memo. 
rizaran el aspecto de cada una de las fotografías reforzadas y de las no reforzadas 
SIN prestar una atención particular a la presencia o ausencia de árboles. Esta 
posibilidad es plausible cuando se utiliza un pequeño número de fotos, por ue las 
palomas poseen una memoria notable para las escenas visuales. Pueden memori 
zar al menos 80 fotos diferentes. En un reciente estudio, por ejemplo, Greene 
(1983) adiestró a unas palomas para discriminar entre la presencia y la ausencia 
de una persona, presentando repetidamente 80 fotos de escenas diversas (40 con 
la persona y 40 sin ella). Utilizando pruebas especiales, fue capaz de demostrar 
que las palomas habían aprendido a responder correctamente cuando se les pre- 
sentaba una foto con la persona, no por el hecho de responder a la persona Sin 
porque habían memorizado el fondo de cada fotografía reforzada. e 
En el estudio de Herrnstein y otros (1976), sin embargo, la memorización de 
cada fotografía reforzada y no reforzada no era, probablemente, la causa de que 
O Aomas lograran un rendimiento satisfactorio, porque se utilizaron entre 500- 
otografías, y sólo ocasionalmente se repetían las fotos. Herrnstein y Otros 
también intentaron excluir la memorización de la foto utilizando un conjunto 
completamente nuevo de fotos al final del entrenamiento. Las palomas actuaban 
casI tan correctamente con las fotografías nuevas como con las fotografías utiliza- 
das durante el entrenamiento inicial. Se producían tasas de picoteo mucho más 
altas en presencia de diapositivas nuevas que contuvieran un árbol (o parte de él) 
que en presencia de nuevas diapositivas que no contuvieran árboles. Se obtuvie- 
ron resultados similares en experimentos que implicaban la presencia O ausencia 
de agua (lagos, océanos, estanques, etcétera) o la presencia o ausencia de una 
oras Oncrera (con trajes distintos, en situaciones diferentes, haciendo cosas 
e las palomas de los estudios de Herrnstein y otros (1976) no memorizan 
as e o orzada y no reforzada, ¿cómo aprenden a responder correctamente? 
on, q lan los seres humanos adultos si se enfrentaran a una tarea 
similar. Recuérdese que las palomas no reciben instrucciones verbales (ni se les 
podrían dar) Para conseguir que las respuestas en presencia de árboles sean refor- 
zadas. Sin tales instrucciones, las personas, sin duda, cometerían errores hasta que 





á64 MICHAEL DOMJAN Y BARBARA BURKHARD 


aprendieran que se requería de ellos que respondieran cuando se les mostraba un 
árbol o una parte de un árbol. Durante el experimento, no tendrían que aprender 
el concepto de árbol. Tendrían simplemente que aprender qué hacer siempre que 
vieran una foto con una parte de un árbol. Quizá las palomas enfocan el problema 
del mismo modo. Quizá ellas también «saben» ya qué son los árboles y simple- 
mente tienen que aprender qué hacer cada vez que ven un ejemplo de árbol. 
Pueden haber aprendido el concepto de árbol en su experiencia anterior o pueden 
«saber» de forma innata lo que es un árbol. Puede que en las aves sea adaptativa 
la predisposición innata para los conceptos de cosas que tienen lugar de modo 
natural, como los árboles, el agua, las personas. Con todo lo atractiva que esta 
hipótesis pueda resultar, no es capaz de explicar otros casos de formación de 
conceptos en las palomas. Por ejemplo, los estudios han mostrado que las palo- 
mas pueden aprender a responder en base a la presencia o ausencia de peces en 
fotografías submarinas (Herrastein y deVilliers, 1980). Las palomas nunca han 
tenido la oportunidad de ver a lo largo de su vida escenas submarinas, ni es 
probablemente adaptativo para las palomas la capacidad de formarse el concepto 
de pez. Otros experimentos han mostrado que las palomas pueden aprender con- 
ceptos totalmente artificiales, tales como la letra «A» mostrada en diversos estilos 
(Morgan, Fitch, Holman y Lea, 1976). 

Si la formación de conceptos no implica una memorización de ejemplos espe- 
cíficos ni el uso de conceptos ya existentes, ¿qué implican? Otra posibilidad es la 
contemplada por el análisis de la característica. Quizá todas las fotos reforzadas 
tenían en común una característica estimular concreta y la respuesta instrumental 
se condicionaba a esta característica estimular. Según esta explicación, los sujetos 
respondían adecuadamente a estas fotos nuevas porque las fotos nuevas contenían 
la característica estimular esencial. Los investigadores de la formación de concep- 
tos perceptuales se han manifestado en contra de la explicación simple que ofrece 
el análisis de la característica porque, a menudo, ha resultado imposible identificar 
una característica común a todos los ejemplos positivos de un. mismo concepto. 
En el experimento del concepto de árbol, por ejemplo, muchos Me los árboles que 
se mostraban eran de color verde, tenían hojas, y eran verticales, leñosos y con 
ramas. Sin embargo, las palomas también respondían a fotos [de árboles que no 
poseían esas características. Además, no respondían a fotosique no tenían un 
árbol, pero que tenían algunos componentes verdes, con hojas, leñosos, verticales 
y con ramas. El problema para identificar un árbol por las características estimu- 
lares esenciales es similar al problema de especificar el concepto de «silla». Es 
difícd abstraer una característica estimular esencial o una combinación de caracte- 
rísticas esenciales. 

Dadas las dificultades para identificar tales características estimulares en los 
experimentos sobre conceptos perceptuales, los investigadores han llegado a con- 
siderar que los conceptos perceptuales implican la aplicación de una regla poli- 
mórfica para la construcción de una categoría (por ejemplo, Herrnstein, 1984; 
Lea y Harrison, 1978). La aplicación de una regla polimórfica requiere la identifi- 
cación de las características estimulares. Sin embargo, la regla polimórfica no 
considera ninguna característica concreta del estímulo como necesaria mi sufi- 
ciente para su inclusión en una categoría. Se considera que son importantes una 
variedad de características, pero no que una característica por sí sola, ni en com- 
binación con otras características, sea esencial para identificar un elemento como 


o 


- PRINCIPIOS DE APRENDIZAJE Y DE CONDUCTA 465 


perteneciente a una categoría. Así, el ser de madera, con hojas y vertical pueden 


ser todas ellas características importantes de los árboles, pero ninguna de esas 


características es necesaria ni suficiente para identificar algo como un árbol, 
La explicación de los conceptos perceptuales como provenientes de la aplica- 
ción de las reglas polimórficas ha conservado el análisis de la característica como 
un aspecto importante del aprendizaje de conceptos, y ha estimulado a los inves- 
tigadores a identificar las características relevantes de los procedimientos de dis- 
criminación de conceptos (Lea y Ryan, 1983). Surge así un problema afín: ¿qué 
convierte a algo en característica de un objeto o de un acontecimiento? ¿Son 
dichas características propiedades elementales inherentes al objeto, o son «crea- 
ciones» del organismo que las percibe? Esas cuestiones son similares al problema 
central del control por el estímulo que planteábamos en el capítulo 8: ¿a qué se 
debe que ciertos aspectos del ambiente adquieran un control sobre la conducta 
instrumental? Las características surgen del modo en que un animal ve un objeto 
o un acontecimiento. Están determinadas, en parte, por predisposiciones percep- 
tuales y por contingencias de reforzamiento. En cierto sentido, en un procedi- 
miento de discriminación de conceptos se modela la formación de un concepto 
perceptual reforzando unos estímulos y no otros. Si se refuerza el responder a 
toda criatura de cuatro patas, y no se refuerza el responder a toda criatura que no 
tiene cuatro patas, el sujeto adquiere un concepto muy amplio. Por el contrario, el 
reforzamiento de respuestas ante ejemplos de perros de la raza caniche pero no 
ante ejemplos de pastores alemanes llevaría a la adquisición de un concepto más 
restringido. Por último, es probable que el aprendizaje de conceptos moldeados por 
contingencias de reforzamiento esté limitado por predisposiciones innatas para 
clasificar los estímulos de formas concretas (Herrnstein, 1984; Marler, 1982). 


EL RAZONAMIENTO INFERENCIAL Y El ANALOGICO 


La presente sección sobre el razonamiento inferencial y el analógico, y la sec- 
ción sobre el aprendizaje del lenguaje que viene a continuación, discuten aspectos 
de la conducta que hasta fechas recientes se habían considerado capacidades inte- 
lectuales exclusivamente humanas. Ambos aspectos del funcionamiento intelec- 
tual han sido estudiados en chimpancés. Las investigaciones sobre el aprendizaje 
del lenguaje en chimpancés han generado mucha más controversía que las inves- 
tigaciones sobre el razonamiento inferencial y analógico. Sin embargo, las dos 
áreas de investigación son fascinantes y suministran pruebas empíricas relevantes 
para las antiguas creencias acerca del papel especial de los seres humanos en el 
reino animal. 


El razonamiento inferencial transitivo 


Anteriormente, en este mismo capítulo, hemos discutido cómo aprenden las 
ratas una secuencia de cantidades de comida, tal como la que formarían números 
diferentes de bolitas de comida dispuestos en un orden monotónico (14-7-3-1-0), 
En tales experimentos, los sujetos fueron expuestos una y Otra vez a la serie 
completa de estímulos. ¿Pueden los animales inferir el orden de una serie mono- 
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tónica de estímulos si sólo experimentan segmentos de la serie? Douglas Gillan 
(1981, 1983) planteó recientemente esta cuestión con chimpancés. 

La capacidad para inferir el orden de una serie monotónica a partir de la 
experiencia con segmentos de la serie puede ser una habilidad adaptativa. Consi- 
dérese, por ejemplo, un grupo social de tres monos, A, B y C. Supóngase que los 
monos A y B se ponen a pelear, y A derrota a B. Los monos B y € se ponen 
también a pelear y B derrota a C. ¿Debería C, conociendo los resultados de las dos 
peleas, ponerse a pelear con A? Ya que C nunca ha peleado con A, basándose en 
la experiencia directa C no podría saber el desenlace. Sin embargo, el saber que A 
puede derrotar a B y que B puede derrotar a C, sugiere que Á puede derrotar a C. 
Este razonamiento implica realizar una inferencia transitiva. , 

Una inferencia transitiva es una decisión basada en la reconstrucción de una 
serie monotónica después de una experiencia limitada a segmentos de la serie. Se 
pueden obtener pruebas de que se produce razonamiento inferencial pidiendo a 
los sujetos que juzguen el orden de un par de estímulos desconocidos después del 
entrenamiento con otros pares de estímulos. Como veremos, sin embargo, los 
pares de estímulos del entrenamiento tienen que elegirse cuidadosamente para 
que permitan la reconstrucción de la serie monotónica. | o 

Gillan (1981, 1983) realizó pruebas de razonamiento inferencial transitivo 
con tres chimpancés hembra de 5-6 años de edad, Jessie, Luvie y Sadie. Aunque 
los sujetos habían sido utilizados previamente en Otras pruebas de cognición ani- 
mal, no se les había enseñado un sistema de lenguaje. Se utilizaron para el expe- 
rimento cinco recipientes de comida con tapas de diferentes colores (rojo, azul, 
naranja, negro o blanco). El experimentador colocaba los cinco recipientes, desig- 
nados con letras de la A a la E, en un orden serial, A<B<CID<E. Sin embargo, 
en cada ensayo sólo se presentaban al mismo tiempo dos pares adyacentes de 
recipientes: A<B, B<C, CD, o DEE. El chimpancé tenía que escoger cada vez el 
recipiente que fuera «mayor que» su acompañante dentro de la serie monotónica. 
Así, B era lo correcto en la elección entre A y B, pero B era lo incorrecto en la 
elección entre B y C. La elección correcta se reforzaba con una pieza de su comida 
favorita (caramelo, galleta o rosquilla) que se colocaba en el recipiente Correcto 
durante ese ensayo. 

El entrenamiento continuó durante unos dos meses, con 12 a 24 ensayos por 
sesión. Al final del entrenamiento, Sadie alcanzó el rendimiento mejor, respon- 
diendo correctamente en el 89 por 100 de las elecciones adyacentes. Luvie y Jessie 
consiguieron sólo el 72 por 100 y el 69 por 100, respectivamente, de puntuaciones 
correctas. La fase esencial de la prueba en el experimento consistía en presentar a 
los chimpancés una elección entre dos estímulos que no habían aparecido juntos 
durante el entrenamiento, B frente a D. Si el entrenamiento con pares adyacentes 
de estímulos capacitaba a los chimpancés a inferir toda la serie monotónica, 
entonces elegirían D como «mayor que» B. Dado que este razonamiento inferen- 
cial requiere el conocimiento del orden de los pares adyacentes de estímulos, la 
actuación durante la elección entre B y D debería estar relacionada con la correc- 
ción en las respuestas de las elecciones adyacentes. Los resultados apoyaron gene- 
ralmente esas predicciones. Sadie, que había alcanzado el grado más alto de exac- 
titud en las elecciones entre estímulos adyacentes, eligió correctamente (D antes 
que B) en 12 de los 12 ensayos. Luvie y Jessie actuaron peor, seleccionando D sólo 
en 5 y 7 ensayos, respectivamente, de los 12 realizados. 
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Después de la primera sesión de prueba, Luvie recibió un entrenamiento adi- 
cional con pares de estímulos adyacentes, y después se realizó de nuevo una 
prueba con B frente a D. Esta vez, la corrección con los pares de estímulos adya- 
centes mejoró hasta un 88 por 100, y eligió correctamente D frente a B en 10 de 
los 12 ensayos. Así pues, también mostró una generalización de la conducta de 
elección correcta a un par de estímulos no adyacentes. 

Es difícil explicar por qué Sadie y Luvie eligieron el estímulo D antes que el B 
durante las sesiones de prueba, sin postular la existencia de razonamiento infe- 
rencial. Ellas no habían encontrado esta elección concreta durante el entrena- 
miento, y por tanto, no habían sido condicionadas a dar una respuesta concreta en 
presencia de esta combinación de estímulos. Además, durante el entrenamiento, 
los estímulos B y D se emparejaban con la misma frecuencia con un reforzador, 
pues cada estimulo aparecía tanto como elección correcta en algunos ensayos del 
entrenamiento (A frente a B; C frente a D), como elección incorrecta en otros 
ensayos (B frente a C; D frente a E). Por tanto, la frecuencia del reforzamiento (o 
no reforzamiento) asociada a las elecciones de B y D no puede explicar la elección 
entre ellos durante la prueba. 

En este estudio se suponía que la elección entre estímulos no adyacentes (B 
frente a D) durante la sesión de prueba reflejaba el hecho de que los estímulos del 
entrenamiento constituían una serie monotónica. Sadie y Luvie infirieron, posi- 
blemente, esta secuencia. Si esto es así, entonces la elección entre estímulos no 
adyacentes durante la sesión de prueba debería ser distinta si se alterara el orden 
monotónico de los estímulos del entrenamiento. Gillan puso a prueba esta predic- 
ción realizando un entrenamiento adicional con Sadie. Durante este entrena- 
miento adicional, Sadie siguió recibiendo ensayos de AXB, B<C, CD, y DE. Se 
añadió otro elemento, F, a estas comparaciones, y los sujetos recibieron ensayos 
en los que se reforzaba E en la elección con E (E<E). Así pues, se colocaron los 
estímulos desde A hasta F en un orden monotónico, A<X<B<C<ID<ESE, y Sadie 
era reforzada siempre que elegía el estímulo «mayor» de cada par de estímulos 
del entrenamiento. Sadie también recibió entrenamiento con el par de estímulos 
A frente a F. Para mantener el orden monotónico de los estímulos desde A hasta 
F, F debería haber sido reforzado en una elección con A. Sin embargo, Gillan 
suministró reforzamiento por A, destruyendo así el orden monotónico estable- 
cido por los otros ensayos del entrenamiento. Una vez establecidos los pares de 
estímulos A<B, B<C, C<D, DE, EF, y FA, los estímulos desde A hasta E no 
pueden colocarse en un orden monotónico. 

Sadie tardó mucho tiempo en aprender a hacer la elección correcta con los 
nuevos pares de estímulos. En particular, cometió muchos errores con A frente a 
E, seleccionaudo F en vez de A. Pero, finalmente, consiguió una exactitud del 90 
por 100, y se le puso a prueba con otros pares de estímulos no adyacentes: B 
frente a D, B frente a E, y C frente a E. Es importante advertir que durante el 
entrenamiento esos estímulos (desde B hasta E) habían aparecido formando pares 
que podían colocarse en un orden monotónico (B<C<D<E). Durante el entre- 
namiento sólo los estímulos A y F formaban el par que destruía la secuencia * 
monotónica. No obstante, se alteraron enormemente las elecciones entre los 
estímulos no adyacentes desde B hasta E. La alteración del orden monotónico 
producida al manipular los estímulos A y EF reducía, de forma imprevista, el ren- 
dimiento de Sadie en las elecciones entre los estímulos desde B hasta E. Estos 
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resultados ofrecen pruebas fehacientes de que la conducta de elección de Sadie 
reflejaba una inferencia acerca de la estructura de toda la serie de estímulos 
basada en la experiencia del entrenamiento con pares de estímulos adyacentes. 


El razonamiento analógico 


En los estudios anteriores se pedía a los chimpancés que realizaran una infe- 
rencia acerca del orden de una serie de estímulos. En el razonamiento analógico, 
la tarea consiste en inferir una relación entre un par de estímulos de muestra y 
aplicar esta relación a un nuevo par de estímulos de prueba. La valoración de la 
capacidad intelectual humana, con frecuencia, incluye pruebas de razonamiento 
analógico. Por ejemplo, un item de una prueba puede ser «irex es a vía como 
coche es a -_———.—». Para responder al item correctamente, tenemos que inferir 
primero la relación «va sobre» de los estímulos tren y vía de la muestra. La 
aplicación de esta relación al estímulo de prueba coche, proporciona la respuesta 
carretera. Gillan, Premack y Woodruff (1981; véase también Gillan, 1983) demos- 
traron razonamiento analógico en una chimpancé de 16 años, Sarah, que previa- 
mente había recibido entrenamiento extenso en varias tareas cognitivas. A Sarah 
se le había enseñado también un lenguaje simbólico, que vamos a describir en la 
sección siguiente (véase fig. 12.9). 

En un conjunto de experimentos, Sarah fue sometida a pruebas con una serie 
de analogías perceptuales. Como estímulos se usaron una serie de formas geomé- 
tricas recortadas en cartulinas de colores y pegadas en un cartón. Variaban en 


Problema Á Problema B 





Figura 12.7.—Estimulos geométricos y estrucrura de los problemas usados por GiJlan, Premack y 

Woodrulf (1981) en un test de razonamiento analógico en chimpancés. Los problemas se presentan 

sobre la línea horizontal, y las posibles respuestas bajo esa línea. (Según Gillan, Premack y Woodruff, 
1981.) 
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cuanto a forma, color, tamaño, y la presencia o ausencia de un punto negro fácil 
de advertir. La figura 12.7 muestra dos ejemplos de los problemas de la prueba. 
Se le presentaron a Sarah los estímulos en una bandeja, tal como aparecen en la 
figura 12.7. Los estímulos de muestra para un ensayo determinado se presentaron 
en el lado izquierdo. El problema A de la figura 12.7 consistía en un diente de 
sierra grande y uno pequeño. Al lado de los estímulos de muestra fue colocado un 
simbolo que Sarah había aprendido previamente como «igual a», a continuación 
del cual aparecía uno de los estímulos de prueba. La parte inferior de la bandeja 
contenía dos estímulos de elección, uno de los cuales completaba correctamente la 
analogía. En el problema A, la relación entre el estímulo de muestra de la parte 
superior y el de la inferior era «más pequeño que». Dado que el estímulo de la 
derecha de la prueba era un triángulo grande con un punto, el estímulo correcto 
para completar la analogía era un triángulo pequeño con un punto. 

En el problema B de la figura 12.7 se utilizaban los mismos estímulos de 
elección en la parte inferior de la bandeja que en el problema A. Sin embargo, 
esta vez la diferencia entre los estímulos de la parte superior e inferior de la 
muestra era que al de la parte inferior le faltaba un punto. Por tanto, la elección 
correcta era el triángulo grande sin punto. Gillan y otros (1981) utilizaron 26 
pares de problemas, como el par que se muestra en la figura 12.7. (Los dos pro- 
blemas de un par se mezclaban con todos los otros problemas, de forma que no 
aparecieran en un orden consecutivo.) La utilización de pares de problemas que 
tenían siempre los mismos estímulos de elección, pero con diferentes respuestas 
correctas, impedía a Sarah resolver las analogías escogiendo siempre sus estímu- 
los predilectos. 

Sarah resultó notablemente apta para la resolución de analogías perceptuales. 
En los primeros 52 problemas diferentes que se le presentaron, dio la respuesta 
corrécta el 85 por 100 de las veces. El rendimiento de Sarah fue uniformemente 
bueno en todas las sesiones. Durante la primera sesión, con 12 problemas, res- 
pondió correctamente el 85 por 100 de ellos. Así pues, su rendimiento probable- 
mente reflejaba un aprendizaje previo, más que un aprendizaje a lo largo del 
experimento. 

El experimento descrito arriba requería la abstracción y aplicación de relacio- 
nes perceptuales («más pequeño que», «le falta un punto», etcétera). En un estu- 
dio posterior, Gillan y otros (1981) realizaron pruebas con Sarah sobre analogías 
conceptuales. Aquí, el aspecto físico de los estímulos no suministraba clave alguna 
sobre la relación planteada. Ántes bien, esta relación se basaba en las funciones de 
los objetos que se presentaban. La figura 12.8 muestra un par de problemas de 
este tipo. Las muestras se presentaron de nuevo en el lado izquierdo de la ban- 
deja, los estímulos de prueba en el derecho, y las alternativas de elección en la 
parte inferior. En el problema A de la figura 12.8 las muestras eran un candado y 
una llave. La relación funcional entre ellas es que la llave abre el candado. El 
estímulo de prueba es una lata y las elecciones son un abrelatas y uma brocha. La 
elección correcta es el abrelatas, porque tiene la misma relación funcional con la 
lata que la llave con el candado. En el problema B se utilizan de nuevo las mismas 
elecciones, pero esta vez la relación que se prueba es «marcar o colorear», lo que 
convierte a la brocha en la elección correcta. 

Sarah realizó una prueba con 9 pares de problemas como los que se muestran 
en la figura 12.8. Todos los problemas utilizaban objetos familiares para Sarah. 
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Problema A 


Problema B 


din usados por Gillan, Premack y Woodruff (1981) en un test de razonamiento 
£ co en chimpancé. Los problemas se presentan sobre la línea horizontal, y las posibles respues- 


fas se presentan debajo. (Según Gillan, Premack y Woodruff, 1981.) 


De nuevo, su rendimiento fue llamativamente correcto. R 


piada con el 85 por 100 de los 18 problemas diferentes 
Las demostracion 


importantes porque 


ealizó la elección apro- 
es anteriores de razonamiento inferencial y analógico son 
pea y muestran que esas habilidades intelectuales no son única- 
e anas. Los estudios sobre razonamiento inferencial se llevaron a cabo 
con chimpancés que no habían pasado anteriormente por un entrenamiento de 
lenguaje. Por tanto, podemos concluir que el razonamiento inferencial en lo 
io es posible sin habilidades lingúísticas. Ya que Sarah había pasado pe 
EE E io de lenguaje, es preciso que se realicen investigaciones 
ales para determinar sí el razonamiento analógico es posible sin lenguaje 
Ahora que sabemos que los chimpancés son capaces de realizar ias i 
inferencia] y analógico, se puede animar a los investigadores a que estudien t de 
bién en otras especies esas capacidades intelectuales. E 


LA ENSEÑANZA DEL LENGUAJE A LOS CHIMPANCES 


Quizá la habilidad cognitiva más compleja sea el uso del lenguaje. De hecho 
muchos han Supuesto que el uso del lenguaje es tan complejo y especializado de 
existe sólo en los seres humanos. Según este punto de vista la ca da 
utilizar el lenguaje depende de ciertos procesos innatos que els itevicada sá 
Ruestra propia especie (por ejemplo, Chomsky, 1972; Lennenberg, 1967). Por'el 
contrario, Otros han Propuesto que los seres humanos usan el len dae ore ue 
particularmente inteligentes y porque han tenido el ana Ea 
Porque sean los únicos organismos con la dotación genética adecuada). Esta 
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segunda concepción sugiere que los animales no humanos pueden también adqui- 
rir el lenguaje, con tal de que sean suficientemente inteligentes y reciban el 
entrenamiento adecuado. Movidas por esta posibilidad, numerosas personas han 
intentado enseñar habilidades lingúísticas a los animales. S1 este esfuerzo lograra 
tener éxito, se terminaría de una vez por todas con los debates sobre la unicidad 
de los seres humanos para la adquisición del lenguaje. Si pudiéramos enseñar el ' 
lenguaje a los animales, podríamos ser capaces también de comunicarnos con 
ellos y, de este modo, avanzar en la comprensión de sus vidas. Hablar con un * 
animal sería algo así como hablar a un extraterrestre. Podríamos ver por primera ; 
vez cómo aparece el mundo ante los individuos no humanos. Podríamos también ' 
conseguir una comprensión única de nosotros mismos. Veríarmos por primera vez : 
cómo son concebidas nuestras acciones por un organismo no sesgado por las . 
experiencias humanas y el etnocentrismo. 

La mayoría de los esfuerzos para enseñar el lenguaje a los animales se han 
llevado a cabo con chimpancés porque, de todos los primates, el chimpancé es el 
que más se asemeja al ser humano. Sin embargo, a pesar de sus muchas semejan- 
zas, los chimpancés no aprenden a hablar cuando se. les somete a las mismas 
experiencias que atraviesan los niños cuando aprenden a hablar. Esto resulta claro 
cuando se observa a chimpancés criados como hijos ea hogares humanos. 
Nadezhda Kohts, del Museo Darwiniano de Moscú, crió un chimpancé en su casa 
desde 1913 a 1916, sin que llegara a imitar ni una sola vez la voz humana ni a 
pronunciar una palabra en ruso (véase A. J. Premack, 1976). Disponemos de más 
explicaciones detalladas de la vida con un chimpancé, a través de las experiencias 
de Winthrop y Louise Kellogg, que en los años treinta criaron juntos a un chim- 
pancé y a su hijo desde que eran bebés (Kellogg, 1933). Tampoco el animal 
adoptado aprendió a hablar de forma normal. Impertérritos ante esta evidencia, 
Cathy y Keith Hayes criaron a un chimpancé llamado Viki con la intención explí- 
cita de enseñarle a hablar (Hayes y Hayes, 1951). Á pesar de varios años de 
esfuerzo, Viki aprendió a decir sólo tres palabras: papá, mamá y taza (en inglés, 
cup). 

Durante casi veinte años, los esfuerzos y fracasos de Hayes para enseñar el 
lenguaje a Viki desalentaron a otros de intentar enseñar a hablar a los chimpan- 
cés. Sin embargo, en los últimos años se está produciendo un resurgimiento con- 
siderable del interés por enseñar a hablar a los chimpancés, estimulado en parte 
por el renovado enfoque de Allen y Beatrice Gardner (Gardner y Gardner, 1969, 
1975, 1978). En vez de enseñar a hablar a su chimpancé Washoe utilizando la 
vocalización, intentaron enseñarle a comunicarse usando el Lenguaje Ámericano 
de Signos. El Lenguaje Americano de Signos consiste en gestos manuales en lugar 
de palabras, y es utilizado por los sordos en América del Norte. Los chimpancés 
son mucho más hábiles para realizar movimientos y gestos con las manos que 
para realizar los movimientos de boca, lengua o labios que requiere la producción 
de los sonidos del habla. Washoe fue un buen alumno. Aprendió a reconocer 132 
palabras. El éxito de Washoe sugiere que los primeros esfuerzos por enseñar a 
hablar a los chimpancés pueden haber fracasado no por la incapacidad del chim- 
pancé para intervenir en la comunicación a través del lenguaje, sino porque se 
utilizó un medio inadecuado (la vocalización). Washoe mantiene viva la espe- 
ranza de que, dados los medios adecuados para el lenguaje, podría establecerse 
una comunicación significativa entre los chimpancés y los seres humanos. 
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La investigación contemporánea sobre el lenguaje en primates no humanos se 
está desarrollagdo en dos sentidos. Algunos investigadores siguen usando el enfo- 
que adoptado por Gardners de enseñar el Lenguaje Americano de Signos a los 
chimpancés (por ejemplo, Fouts, 1972; Terrace, 1979; Terrace, Pettito, Sanders y 
Bever, 1979) y a los gorilas (Patterson, 1978). Se ha desistido del enfoque de 
enseñar a hablar a los chimpancés vocalizando. Sin embargo, en vez de adoptar 
un lenguaje humano activo, tal como el lenguaje de signos, el segundo enfoque 
implica un lenguaje artificial. El lenguaje artificial fue desarrollado y utilizado por 
David Premack y sus colaboradores, y consiste en unas figuras de plástico de 
varias formas en lugar de palabras (Premack, 1971b, 1976). La figura 12.9 mues- 
tra ejemplos de símbolos de plástico, que tienen un metal en la parte posterior y 
se colocan en un tablero magnético en orden vertical, como en el idioma chino, 
para formar frases. Otro lenguaje artificial, desarrollado por Duane Rumbaugh y 
sus colaboradores en el Centro de Investigación con Primates de Yerkes, utiliza 
formas geométricas de varios colores para representar palabras (Rumbaugh, 
1977). 

En las investigaciones que se basan en lenguaje artificial, el contexto del 
entrenamiento para el lenguaje difiere, a menudo, del usado en los intentos por 
enseñar lenguaje de signos a los chimpancés. El entrenamiento del lenguaje de 
signos se lleva a cabo, normalmente, dentro del contexto de una relación social 
entre el entrenador y el chimpancé. Puede que el chimpancé no crezca como un 
niño dentro de la familia. Sin embargo, vive en un ambiente rico. que no es de 
laboratorio y todo el día está cuidado por un pequeño número de personas, cada 
una de las cuales es una experta en lenguaje de signos. Mientras el chimpancé 
está despierto se realiza todo tipo de esfuerzo para que intervenga en una conver- 
sación activa (por signos). De esta forma, el entrenamiento del lenguaje consti- 
tuye una parte de las experiencias «naturales» del sujeto. Se aprenden nuevos 


Figura 12.9.—Ejemplos de sim- 

bolos del lenguaje artificial desa- 

rrollado por David Premack y 

sus colaboradores. (Según D. Pre- 
mack, 1976.) 
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signos durante los juegos, mientras se viste y se desviste, o cuando va de un sitio a 
otro. Se llevan también a cabo sesiones de entrenamiento organizadas. Sin 
embargo, se utiliza la relación social entre el entrenador y el sujeto para fomentar 
la conducta de signos, más que los reforzadores explícitos, tales como caramelos, 
pastelitos o bebidas. Lo que se intenta es enseñar el lenguaje a los chimpancés ral 
como, presumiblemente, aprenden los niños a hablar en el curso normal de inte- 
racción con los padres y hermanos. 

Frente a los esfuerzos por crear un contexto natural para el entrenamiento del 
lenguaje por signos, los investigadores que utilizan lenguajes artificiales normal- 
mente llevan a cabo el entrenamiento del lenguaje en una situación de laboratorio 
más cerrada, usando de forma explícita reforzadores. En el proyecto de Yerkes, 
por ejemplo, los símbolos de las palabras aparecen en teclas de un teclado (como 
en una máquina de escribir), que se conecta con un ordenador. El chimpancé 
puede «hablar» al ordenador y hacer varias preguntas. El ordenador, a su vez, se 
comunica con el chimpancé con símbolos que se presentan en un panel. Esta 
disposición es muy distinta de la interacción social en la que los niños habitual- 
mente aprenden el lenguaje. Sin embargo, el método de comunicación por orde- 
nador facilita mucho la obtención de un registro permanente de rodas las respues- 
tas lingúísticas del sujeto. Esas respuestas pueden ser automáticamente regis- 
tradas para análisis posteriores. 

El considerable esfuerzo que se ha dedicado a enseñar el lenguaje a primates 
no humanos ha producido, al menos, un resultado indiscutible. Está claro que los 
chimpancés y los gorilas pueden aprender a utilizar estímulos arbitrarios (gestos 
manuales, objetos de plástico o formas geométricas de colores) como símbolos de 
las cosas y las relaciones que se dan en su ambiente. Los primates no humanos 
son capaces de aprender bien un vocabulario de más de 100 palabras. A modo de 
ejemplo, se presenta el vocabulario de Washoe después de cincuenta y un meses 
de entrenamiento, en el mismo orden en que este animal fue expresando cada 
palabra (Gardner y Gardner). 





ven y dame cepillo (frotar) cuerda 
más sombrero árbol 
arriba yo luz 
dulce zapatos rojo 
escuchar (oír) Roger martillo 
cepillo de dientes oler blanco 
bebida bueno nNOSOtros 
dafio Washoe carne 
perdón pantalones fumar 
divertido abrir silla 
por favor hacer cosquillas (tocar) hoja. 
comida-comer ir suficiente 
flor fuera bicho 
manta (cubrir) Dr. G. montar 
perro Naomi vaca 

tu fruta (manzana) no 
paño (pañal) peine verde 
en sucio queso 
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negro diferente pepino (rodajas verdes) 
ropa igual Dennis 
gato Larry Ron 

llave hombre morder 
bebé casa pipa 
limpio correr llorar 
coger sonreír hora 
abajo tubo alfiler 
mirar sello (carta) monedero 
Susan avión tenedor 
libro teléfono espejo 
acette caliente (calentar) cereal 

mío tenedor tragar 
cama baya (fresa) agujero 
plátano cuchara mariposa 
abrazar ventana cerrojo 
pájaro hierba Linn 

lápiz (escribir) trepar hielo (frío) 
Sra, G. coche suelo 
tranquilo girar adiós 

Greg tuyo nuez 

ayuda beso querer (hambre) 
Wende no poder allí 

polo mano Don 

agua tomate baño 
mujer quién 


Aunque se acepta que los primates no humanos pueden aprender un vocabu- 
tario, el lenguaje es algo más que una simple colección de palabras. Además de 
vocabulario, el lenguaje requiere la colocación de las palabras en una secuencia, de 
acuerdo con las reglas establecidas por la gramática del lenguaje. Por tanto, un 
problema esencial para la enseñanza del lenguaje a primates no humanos es si 
pueden aprender a construir secuencias de palabras basándose en reglas gramati- 
cales. Existe sobre esto una disputa considerable. La secuencia más corta posible 
de palabras consiste en dos palabras. Sin embargo, la pronunciación de un par de 
palabras no prueba que el sujeto haya usado la gramática para crear esa secuencia. 
Un incidente que ha provocado controversia ocurrió cuando el chimpancé Was- 
hoe vio un cisne en el agua. Nunca anteriormente había estado expuesto a un 
cisne. Cuando se le preguntó: «¿Qué es eso?» respondió «ave agua». ¿Estaba 
Washoe utilizando «agua» como adjetivo (en inglés agua y acuático se dicen igual) 
para especificar el tipo de ave que había visto? Quizá sí. Sin embargo, basándonos 
simplemente en esta información, una interpretación igualmente plausible es que 
el animal hizo la señal de «agua» porque vio el agua y de «ave» porque vio un 
ave. Es decir, pudo haber hecho la señal de «ave agua» como dos palabras inde- 
pendientes antes que como la pronunciación de dos palabras relacionadas una con 
Otra como nombre y adjetivo (Terrace y otros, 1979). 

Pueden también surgir dificultades de interpretación con la ordenación de las 
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palabras dentro de una frase. Considérese la frase siguiente, que podría haber sido 
formada en el proyecto de Yerkes por un chimpancé: «por favor máquina haz 
música». Si el sujeto presionaba en el teclado del ordenador los simbolos apropia- 
dos en el orden apropiado, la máquina obedecía y tocaba música para el chim- 
pancé. Sin embargo, la presión de las teclas en ese orden no prueba que el chim- 
pancé pueda construir una frase. El chimpancé puede, simplemente, haber 
memorizado una frase de símbolos para obtener reforzamiento. Si el chimpancé 
está usando reglas gramaticales, entonces en otras ocasiones debería ser capaz de 
utilizar una variedad de palabras distintas en lugar de cada una de las palabras de 
la frase original. Además, esas sustituciones deberían adecuarse al contexto en el 
que se han formado. El chimpancé debería de ser capaz de utilizar la estructura 
gramatical de «por favor máquina haz música» para construir frases tales como 
«por favor Pedro haz música», cuando Pedro se encuentre presente, «por favor 
máquina para la música» sí la música lleva sonando un rato, o «por favor 
máquina haz dulces» cuando tenga hambre. 

Un análisis de la conducta verbal de Lana, la más famosa de las chimpancés 
del proyecto de Yerkes, realizado al principio del entrenamiento, indicó que no 
aprendía un uso tan flexible de la gramática para crear nuevas frases. Antes bien, 
Lana parecía que había aprendido un conjunto de frases patrón (tales como «por 
favor máquina haz música»), que utilizaba repetidamente, cambiando sólo una o 
dos de las palabras para adaptarlas a la ocasión (Thompson y Church, 1980). Así 
pues, en la frase «por favor máquina haz música» rara vez cambiaba al; uma pala- 
bra, salvo la última. Al cambiar la última palabra, podía usar la misma frase 
patrón para pedir a la máquina que pusiera una película, o diapositivas, que 
encendiera la televisión, que abriera la puerta, la ventana. Este tipo de conducta 
no refleja una verdadera habilidad lingúística. 

Desde entonces, el ordenador que controla las experiencias de Lana con el 
lenguaje ha sido programado para permitir una mayor variación en la estructura 
de las frases, y Lana ha mostrado un correspondiente aumento en la gama de 
frases que produce (Pate y Rumbaugh, 1983). Se vio que en vez de contar con seis 
frases patrón, utilizaba 67 frases de formas diferentes, algunas con hasta 135 
alternativas posibles para las distintas palabras. Otra prueba del aumento en la 
sofisticación de sus habilidades lingúísticas es que, frecuentemente, expresa la 
misma información utilizando estructuras distintas. 

Han surgido también cuestiones sobre la capacidad de formación de conceptos 
que poseen los chimpancés a los que se les ha enseñado el lenguaje por señas. 
Terrace y sus colaboradores han analizado los casos en los que su chimpancé Nim 
realizaba, espontáneamente, más de una señal seguida con el fin de ver si esas 
combinaciones de señales suministraban pruebas de que existía uma estructura 
gramatical (véase Terrace, 1979; Terrace y otros, 1979). Varios aspectos de este 
análisis indicaron que las combinaciones de señas no estaban regidas por el tipo 
de reglas gramaticales que parecen gobernar el habla de los niños en sus inicios. 
En primer lugar, un registro videográfico de Nim con sus profesores mostró que 
muchas frases con señas no eran espontáneas, sino que eran repeticiones de seña- 
les que el profesor había realizado recientemente. Si Nim estaba simplemente 
imitando a sus profesores, sus secuencias de señas no pueden interpretarse como 
pruebas de la construcción de una frase. Otro aspecto de la actuación de Nim que 
sugiere que no estaba aprendiendo el lenguaje de la misma forma que lo aprende 
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un niño es que el número medio de señas que realizaba en una secuencia nunca 
era superior a dos. Por el contrario, una vez que los niños que están aprendiendo 
a hablar (o a hacer señas si son sordos) comienzan a construir frases de más de 
una palabra, la longitud media de sus frases aumenta rápidamente. Además, la 
longitud media de sus frases se acerca a la longitud máxima. Por tanto, un niño 
que dice dos palabras a la vez como promedio no elaborará frases de más de entre 
3 y 7 palabras de longitud. Esos resultados no fueron observados con Nim. Aun 
cuando realizaba un promedio de dos señales de palabra por secuencia, ocasio- 
nalmente construía frases de hasta 16 señales. Sin embargo, sus frases más largas 
no añadían una información significativa a las frases más cortas. Antes bien, con 
frecuencia contenían repeticiones. Por ejemplo, su combinación de cuatro señales 
más frecuente era «comer beber comer beber». A partir de esta prueba, Terrace y 
sus colaboradores concluyeron que su chimpancé no aprendió a utilizar el len- 
guaje, a pesar del hecho de que había aprendido un vocabulario de más de 100 
palabras. 

Las pruebas obtenidas con el chimpancé Nim indican que no aprendió a utili- 
zar frases a lo largo de unos tres años y medio de entrenamiento. Lo que esto 
implica para el problema del lenguaje en los chimpancés es tema de acalorado 
debate. Terrace y sus colaboradores afirman que los datos obtenidos acerca de la 
conducta lingiiística de otros primates no humanos no demuestra tampoco de 
forma concluyente que estos sujetos fueran capaces de construir combinaciones 
gramaticales de palabras. Sin embargo, otros investigadores atacan esta afirma- 
ción. Así pues, el problema del lenguaje en los primates no humanos continúa en 
gran parte sin resolverse. Cabe esperar que las futuras discusiones ayuden a defi- 
nir qué es lo que constituiría una prueba concluyente del lenguaje en los chimpan- 
cés, y que las futuras investigaciones contengan una documentación y un análisis 
de los resultados más rigurosos. Resultará emocionante ver cómo estos progresos 
resuelven, finalmente, el problema del lenguaje en los animales no humanos. 


LA APLICACIÓN DEL ENTRENAMIENTO DEL LENGUAJE 
A NIÑOS DEFICIENTES VERBALES 


La premisa teórica con la que se inició la investigación sobre entrenamiento 
del lenguaje en chimpancés es que el uso del lenguaje es una función intelectual 
capaz de separarse del habla. Esta idea, junto con los procedimientos particulares 
utilizados con los chimpancés, se ha extendido a un trabajo muy interesante con 
niños retrasados y autistas. Los niños con deficiencias físicas, emocionales o men- 
tales, no se comunican de un modo eficaz a través del habla. El habla humana es, 
después de todo, un asunto complicado. Requiere una buena codificación y memo- 
ria auditivas, así como la capacidad de preparar y emitir complicados movimien- 
tos vocales. La producción de sonidos debe, asimismo, trasmitir información. Los 
niños que vamos a describir aquí pueden tener problemas en todas esas áreas o 
sólo en alguna. Muchos niños retardados pueden formar solamente unas cuantas 
frases. La mitad de los autistas nunca aprenden a hablar, y la mayoría de los que 
lo hacen aprenden a hablar de modo anormal (Bartak, Rutter y Cox, 1975; Rim- 
land, 1964). Muchos muestran ecolalia, una imitación de las vocalizaciones de los 
demás parecida a la de los loros. Otros niños deficientes, los paralíticos cerebrales, 
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por ejemplo, no suelen tener control motor suficiente de su aparato vocal como 
para comunicarse a través del habla. Vamos a describir algunas de las técnicas de 
entrenamiento que más se corresponden con la investigación con chimpancés. En 
estas técnicas, el entrenamiento del lenguaje en un primer momento deja de lado 
los mecanismos del habla, y utiliza a cambio. respuestas no verbales. 

Uno de los enfoques del entrenamiento del lenguaje a niños sin conducta 
verbal es similar al del trabajo de Gardners, que utilizaba el lenguaje por señas 
con los chimpancés. Basándose en esta técnica, se han llevado a cabo varios pro- 
yectos impresionantes (para una revisión, véase Fay y Schuler, 1980). Schaeffer 
(1980) describió su trabajo con tres niños autistas. Dos de los niños eran, al 
principio, mudos y uno era ecolálico. El entrenamiento del lenguaje consistía en 
enseñar el lenguaje por señas y la imitación de las vocales en sesiones separadas. 
Como resultado del procedimiento, los niños aprendían a hacer señas espontá- 
neamente. Es decir, eran capaces de juntar varias señas para comunicar sus pro- 
pios deseos, producir muevas configuraciones y generalizar señales para darles 
significados más amplios que los conceptos que tenían asignados inicialmente. 
Después de tres o cuatro meses de entrenamiento comenzaron de hecho a hablar. 
Este resultado es llamativo porque la terapia de habla tradicional resulta dificul- 
tosa y, por lo general, infructuosa con niños autistas (por ejemplo, Hingtgen y 
Churchill, 1969). Cuando el habla aparecía, los terapeutas utilizaban habla con 
señas (habla en concomitancia con señas). Estos tres niños llegaron a ser relat1- 
vamente hábiles y espontáneos con el lenguaje hablado con señas. Después de 
tres meses aproximadamente, los niños comenzaron a hablar sin señas. Final- 
mente, fueron capaces de comunicarse sin señas de forma tan creativa como con 
señas manuales. 

En otros estudios se ha observado también una facilitación del lenguaje 
hablado a través del lenguaje por señas. Creedon (1975, 1976) enseñó lenguaje 
por señas a un conjunto de niños autistas, Se enseñó a hacer señas a un grupo en 
el que estaban incluidos padres y compañeros. Cada nueva seña se reforzaba con 
reforzamiento social (abrazos, golpecitos, etcétera). Todos los niños aprendieron 
a comunicar por señas sus necesidades y deseos básicos. Algunos de ellos, como en 
el estudio de Schaeffer, comenzaron a hablar, espontáneamente, al mismo tiempo 
que se comunicaban por señas. En un principio producían solamente aproxima- 
ciones a una palabra. Más tarde, aparecieron pautas de entonación y vocalización 
más precisas. Además, Creedon observó que los niños mejoraban en varias escalas 
de desarrollo conductual y presentaban menores problemas de conducta. 

¿Por qué resulta el entrenamiento del lenguaje por señas tan eficaz con niños 
sin habla? Se han sugerido varias ideas. Una posibilidad es que algunos de los 
movimientos de las manos que intervienen en la realización de las señas formen 
parte de antemano del repertorio conductual del niño. Los niños autistas utilizan 
sus manos para alcanzar los objetos que desean o para apartar los que no desean, 
de forma muy parecida a como lo hacen los niños normales. Como afirma Schaef- 
fer, ellos ya conocen la relación entre lo que hacen con las manos y la satisfacción 
de sus necesidades. Son ya capaces de ajustar de forma adecuada las respuestas de 
sus manos a diversas situaciones. En el programa de entrenamiento de Schaeffer 
se urilizan los movimientos de las manos dirigidos a un fin como el fundamento 
de la enseñanza del lenguaje por señas. El lenguaje por señas resulta muy ade- 
cuado para incitar otras acciones y se refuerza muy fácilmente. La mayoría de los 
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niños autistas nO poseen impedimentos motores que dificulten el E o 
Esto puede permitir la iniciación de señales espontáneas y ra e as 
establecido el lenguaje manual, la adquisición del lenguaje hablado implica sólo 

edio de comunicación. 
ir pa Premack también trabajaron con un niño autista A 
Premack, 1974) al mismo tiempo que con chimpancés, utilizando su spa : 
símbolos de plástico (véase figura 12.9). Hallaron que el niño pp ' 0 ón 
menos ensayos que los chimpancés. Carrier y sus colaboradores E ne . A 
trabajo más extenso con niños retardados (véase Hollis y Carrier, E o el 
ron un programa llamado Programa de Iniciación a la Lengua No >. es nn 
NoH) con 180 niños retardados. Después de dos años, 125 sujetos habian E 
pletado el programa, y estaban preparados para comenzar un entrenamiento de 
habla. Tal como ocurría en los otros estudios, muchos niños comenzaron a Imi- 
ciarse en el habla mientras estaban aún trabajando en el programa de lenguaje no 
Ln de lenguaje del tipo de Premack es particularmente útil ls 
que tienen limitadas sus capacidades motoras. Manipular símbolos de plástico les 
resulta mucho más fácil que formar señas con las manos. El sistema de lenguaje 
de Premack tiene también ventajas para los niños con déficits de memoria porque 
los símbolos de plástico pueden permanecer a la vista el tiempo que sea Po 
Las palabras habladas y las señas manuales mn breves, y tienen que ser reco 

ra que exista una comunicación satisfactoria. 

A Ls reigaciones sobre el entrenamiento del lenguaje resultan an pe 
tedoras para las personas con deficiencias verbales. Hoy día disponemos le mm 
posibilidades para liberar a los que están encerrados en sí paa pa mp 
que comuniquen sus necesidades y sentimientos a los demás. aa cagon e 
niño que puede dar a conocer por primera vez sus necesidades es, sin duda, 
resultado que merece toda nuestra dedicación científica. 
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Georaxia, 51 

Glándula pineal, 25, 28 

Gouramis, 147 * 

Gradiente de generalización del estímulo exci- 
tarorio, 282-285, 288, 293-297, 301-307, 
315, véase Gradiente de generalización del 
estímulo inhibitorio 

Gradiente de generalización del estímulo inhi- 
birorio, 296 

Gramática, 473-475 

Gusanos de tierra, 51 


Hábito de fumar, 128, 356 
Habituación, 57-75, 138 
adaptabilidad, 57-58 
ámbito, 57-58 
análisis neurológico, 58-62 
curso temporal, 63-64 
efectos de la intensidad y frecuencia del 
estímulo, 67-68 
efectos de un estímulo extraño intenso, 
66-67 
especificidad del estímulo, 65-66 
generalización del estímulo, 65 
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teoría del proceso dual, 61-63, 67 
teoría del repaso, 441-443 
y extinción, 109-110 
Haloperidol, 453 
Hámsters, 359 
Hedonismo, 26-31 
Herbívoros, 265 
Heroína, 141, 142 
Herrerillo de pantano, 424-425 
Hiperactividad, 359 
Hipotermia, 434, 436, 439 
Hipótesis de la discriminación, 231 
Hipótesis de la reducción del EC, 151-152, 
157-158 
Hipótesis de la reducción del El, 151-158 
Hipótesis de Lashley-Wade, 284, 288 
Hipótesis del emparejamiento, 285-286, 378 
Hipótesis del estímulo consumatorio como 
recompensa, 348-349 
Homeostasis 
conductual, 245, 252 
fisiológica, 70, 239-240, 245, 251 
Homosexualidad, 391 


Imagen, véase Representación 
Impulso adquirido, 331-332 (véase también 
Condicionamiento del miedo) 
Indefensión, véase Indefensión aprendida 
Indetensión aprendida, 195-197, 406 
Inferencia transitiva, 466-469 
Infraigualación, 215 
Inbabilitación de la respuesta, 336-339 
Inhibición, 28, 95 (véase también Inhibición 
condicionada) 
Inhibición condicionada, 94, 95, 101-108, 129, 
153-155, 185-186, 387, 388 
como resultado del entrenamiento discri- 
minativo, 296-299, 304-308 
medición, 104-108 
procedimientos, 102-104 
y extinción, 109-110 
y reforzamiento de la conducra de evitación, 
335-336, 343-347, 349-350 
Inhibición diferencial, 103, 289 
Inhibición latente (véase Efecto de preexposi- 
ción al EC) 
Innarismo, 26, 30 
Instrucción programada, 301 
Insulina, 112, 143 
Inteligencia animal, 165-166 
Inteligencia artificial, 407-408 
Interacciones entre el condicionamiento clá- 
sico y el instrumental, 369-402 (véase 
también Evitación, teoría de los dos 
procesos; Teoría de la respuesta emo- 
cional condicionada del castigo) 
condicionamiento clásico en los procedi- 
mientos instrumentales, 371-402 
interacciones de respuesta en, 392-394 


mecanismos rg-eg de las, 378-381, 384-385, 
399 : 
.medición concurrente, 381-385 
reforzamiento instrumental en el condicio- 
namiento clásico, 371-377 
teoría moderna de los dos procesos, 386- 
391, 399 
y expectativas especificas de recompensa, 
400401 
y propiedades estimulares discriminativas 
de los estados condicionados clásicamen- 
te, 395-399 
Interferencia proactiva, 426-427, 433 
interferencia retroactiva, 426-429, 433 
Interneurona, 43-44 
Intervalo D-D, 339, 341, 342, 343 
Intervalo de huella, 93 
Intervalo EC-El, 92-93, 94 
Intervalo entte ensayos, 92 
Intervalo entre estímulos (véase Intervalo 
EC-Eh 
Intervalo R-D, 339, 341, 342, 343 
Introspección informal, 19 
Inundación, 118, 336-339 
Irradiación de la excitación, 284 
Irrelevancia aprendida, 125 


Laberinto de Lashley ]Il, 441-442 
Laberinto en T, 168-169, 212 
Laberinto radial, 417, 418, 419 
Lamer, 381-384 
Lamprea de arroyo, 50 
Langostas, 51 
latencia, 94, 168 
Lenguaje, 36-37, 405, 406, 462, 470-478 
Lenguaje Americano de Signos, 471-478 
Lenguaje de signos, véase Lenguaje Ameri- 
cano de Signos 
Lesión cerebral, 433 
Levantar, 180, 241 
Ley de la igualación, 214 
condiciones de igualación, 214-215 
en la conducta humana, 219 
mecanismos, 218-223 
valor del reforzamiento, 215-216 
y programas de reforzamiento simple, 216 
Ley del efecto, 165, 237-238 
Ley del efecto negativo, 363-364 
Limitaciones del aprendizaje, véase Aprendi- 
zaje, generalidad del; Pertinencia 
Línea de base, 171, 182 (véase Línea de base 
conductual) 
Línea de base conducmal, 172-173, 248, 252- 
233, 255, 363 


Maduración, 34 

Magnitud, 94 

Mantenimiento de la condncta, 201-202 (véase 
también Programas de reforzamiento) 
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Mapaches, 180, 182, 411 
Máquinas pensantes, 408 
Marcapasos, 453-454 
Mecanismo rm-em, 378-387, 399 
Medición concurrenre del condicionamiento 
clásico y el instrumental, 381-385, 386-387, 
389 
Medición del tiempo, 449-451, 452-455 (véase 
también Programas de intervalo fijo) 
Mejoramiento, 222-223 
Memoria 
alteración neurofisiológica, 433-434, 435, 
436-437 
alteración por el estímulo, 426-432 
consolidación, 434, 436 
control por el estimulo, 417-418, 429-432 
de corto plazo, 435, 436, 439-440, 442, 444 
de largo plazo, 435, 436, 442 
de recompensas anteriores, 271-272, 459-461 
de referencia, 410, 411, 452, 453-454 
de trabajo, 410-412, 452, 453-454 
definición, 409 
en la infancia, 409 
mediación de la respuesta en la, 411, 415, 
432-433 
reconocimiento, 436-437 
recuperación, 436-440 
y aprendizaje, 409, 426, 440-445 
Memoria de corto plazo, 435, 436, 439-440, 
442, 444 (véase también Memoria de tra- 
bajo) 
Memoria de largo plazo, 435, 436, 442 
Memoria de reconocimiento, 436-437 
Memoria de referencia, 411, 453, 454-455 
Memoria de trabajo, 410, 429-430, 431, 452- 
453, 454 
en el ajuste demorado a la muestra, 412-417 
en la memoria de referencia, 410-411 
en la recuperación de comida escondida, 
423-424 
en los laberintos radiales, 417-423 
Método de ensayos discretos, 166-169 
Método de Suzuki, 181 
Métodos de operante libre, 166-173 
Modelo de la desviación mínima, 255 
Modelo de la respuesta compensatoria, 140- 
143, 155-157 
Modelo de Rescorla-Wagner, 153-155, 157 
Moldeamiento, 170, 182 
Moluscos, 39 
Monos, 241, 268, 413, 416-417, 427, 429, 
462-476 
Morfina, 113, 141 
Mosca de la fruta, 38 
Motivación, 34, 180, 380-381, 386, 388, 395- 
396 
teoría del proceso oponente, 68-73 
Motivación del incentivo, 240, 244 
Motivación primaria, 240 


Morivos internos, 21 
Música, 181, 294 


Neurona aferente, 43 

Neurona eferente, 43 

Nicotina, 73, 74 

Niños, en la investigación, 53, 61, 114-115, 
117, 174, 247, 289, 363-364, 476-477 

Nivel operante, 171, 182 

Novedad, véase Efecto de preexposición al 
EC, Efecto de preexposición al El; Habi- 

ruación 


| Nucifraga Columbiana, 424 


Numeración, en animales, 449-450, 454-455 


Obsesiones, 59 

Olvido, 109, 418, 428, 429-432 

Opiáceos, 72, 73, 113-114, 141-142 

Optimización, 218-222 (véase también Teoría 
económica) 

Orientación, 286-287 


Palomas, 22, 38, 88-89, 106, 129, 135-136, 
188, 193, 194, 208-218, 224, 225-226, 268- 
269, 278-281, 286, 292, 294, 296, 299, 
311, 318, 373, 412, 413, 414, 427-432, 
462, 463 
Paracaidismo, 73 
Paralización, 347, 348, 360 
Parto, 65 
Pausa postrreforzamiento, 203, 206, 355 
Patrón estándar de la dinámica afectiva, 68 
Pauta fija de acción, 49 
Peces de colores, 413 
Pensamiento, 24 (véase también Razona- 
miento) 
Pentobarbital, 439 
Perezoso de dos pezuñas, 44 
Pertinencia, 179 
en el castigo, 359, 360 
en el condicionamiento clásico, 124-130, 179 
en el condicionamiento de evitación, 346-347 
en el condicionamiento instrumental, 179- 
184, 239, 272 

en el control instrumental por el estímulo, 
311-315 

generalidad de la, 130 

mecanismos de, 129-130, 179, 182-183 

Perros, 45, 81, 82, 86, 136, 313, 314, 335, 372, 
373, 383-385, 398, 410 

Picoteo, 22, 188, 208-218, 224, 268-269, 278- 
299, 315, 317-318, 355, 358, 412-416, 427- 
432, 462, 463 

Pinzones, 55-56, 61 

Platelmintos, 50 

Polidipsia inducida por el programa, 266, 268 

Pollos, 47 

Postrreacción afectiva, 69, 71-74 

Potenciación, 148 
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Precondicionamiento sensorial, 131, 132-133, 
155-156 

Presentación de la ocasión, 318-319 

Presión de le palanca, 86, 143-144, 169, 170, 
174-179, 203, 216, 238, 239, 246, 259, 260, 
261, 262, 277, 309, 334, 341, 342, 346, 349, 
353, 354, 356-357, 361, 380-386, 398-399, 
450, 452 

Principio de transituacionalidad, 238 

Probabilidad, véase Probabilidad de la res- 
puesta 

Probabilidad de la respuesra, 248-250, 251-252 

Problema de elección intermedia, 305-306 

Procedimiento de control aleatorio, 97, 
374-375 

Procedimiento de control por omisión, 
373-376 

Procedimiento de ensayos únicos, 416 

Procedimiento del máximo, 450-453 

Procedimientos de respuesta demorada, véase 
Memoria de trabajo 

Proceso de habimación, 59 

Proceso de sensibilización, 59 

Proceso oponente, 68-70 
teoría de la morivación, 68-74, 156 
teoría del comdicionamiento clásico, 154- 

157 

Proceso primario, 70 

Proceso «a», 70 

Proceso «b», 70 

Programa de entrenamiento del lenguaje de 
Yerkes, 473-475 

Programa reforzamiento de tiempo fijo, 268- 
269 

Programas concurrentes de reforzamiento, 
212-223 

Programas concurrentes encadenados, 223- 
233 

Programas de castigo, 354-358 

Programas de intervalo fijo, 205-206, 229, 
270, 290, 355, 383-384, 450 

Programas de intervalo variable, 206-210, 
211-214, 218-224, 230, 232-233, 266, 278- 
279, 281, 285-286, 353-354 

Programas de razón fija, 203, 205, 206, 212, 
220, 225, 226, 230, 354-355, 383-385 

Programas de razón variable, 204, 207-210, 
221-222, 230-231, 290 

Programas de reforzamiento, 201-205 
concurrente, 210-223 
concurrente encadenado, 223-228 
efectos en la extinción, 228-230 
múltiples, 291 
simples, 201-208 
tasa de respuestas, 210 

Programas de reforzamiento de intervalo, 
205-209 (véase también Programas de inter- 
valo variable) 

Programas de ceforzamiento de razón, 202- 


203, 207-209, 212 (véase también Progra- 
mas de razón fija; Programas de razón 
variable; Reforzamiento continuo) 
Programas simples de reforzamiento, 202-209 
Prueba de la sumación, 107-111, 279-280, 
285-286, 308-316 
Prueba del retraso en la adquisición, 108-111 
Psicología conductual, 21-31, 39-40, 405-406 
Punto de deleite conductual, 252-253, 254-295, 
262-263 


Quimioterapia, 115 
Quinesis, 50-51 


Radiación, 90, 126-128 

Rascarse, respuesta de, 178-179, 180, 182 

Rastros de olor, 418-419 

Raras, 38, 54-55, 61-62, 85, 86, 90, 106, 113, 
126-127, 137-148, 167, 169, 175, 178, 183- 
186, 189, 203, 238, 241, 246-249, 259-265, 
294-295, 309-310, 328-363, 379-380, 393, 
411-424, 429, 433, 438, 440, 445, 449-461 

Ratas canguro, 167 

Rayos X, véase Radiación 

Razón de supresión, 87, 393-394 

Razonamiento, 407-408, 465-470 

Razonamiento analógico, 465, 468-470 

Razonamiento inferencial, 465-467 

RDA, 210 

RDB, 210, 382-383 

RDO, 176 

Reacciones de defensa específicas de la espe- 
cie, 347-350 

Reactivación, véase Recordatorio 

Recordatorio, 429-432, 437-439 

Recuperación, 436-444 (véase también Recor- 
datorio) 

Recuperación de la comida escondida, 423-425 

Recuperación espontánea, 64, 109, 228 

Redistribución de las respuestas, véase Enfo- 
ques de respuesta múltipie 

Reducción de la frecuencia de la descarga, 
345-346 

Reducción del impulso, 239-242, 246, 255-256, 
348-349 

Reflejo de flexión, véase Flexión de la para 

Reflejo de oclusión respiratoria, 46 

Reflejo de volver la cabeza, 46 

Reflejos, 24 

Reforzamiento 
cantidad de, 216-217, 223-227 
como regulación conductual, 245-265 
cuestiones fundamentales acerca del, 237-239 
de la conducta de evitación, 330, 343-350 
demora del, 189-192, 193, 217, 223-227, 334 
intrínseco, 216 
secundario, 189 
teoría de la reducción del impulso, 239-241, 

245-246, 255-256 
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teoría de la respuesta consumatoria, 245-246 
teoría de la selección de la respuesta, 266-273 
teoría de Premack, 246-251 
teoría del abastecimiento óptimo, 262-266 
teoría económica del, 255, 256-262 
Reforzamiento accidental, véase Reforzamien- 
to adventicio 
Reforzamiento adventicio, 193, 212, 360 
Reforzamiento condicionado, 189 
Reforzamiento continuo, 202, 230, 231-232 
Reforzamiento diferencial, 176, 209, 210, 
382-384 
Reforzamiento intermitente (véase Progra- 
mas de reforzamiento) 
Reforzamiento negativo, 175-176, 344, 345, 
382-383, 387-391 
Reforzamiento parcial, 202, 230 (véase Pro- 
gramas de reforzamiento) 
Reforzamiento por estimulación cerebral, 242- 
244, 400 
Reforzamiento positivo, 174-175, 381 
de la conducta de evitación, 343-350 
papel del, en el castigo, 354, 355-359 
Reforzamiento secundario, 189 
Reforzamiento sensorial, 241-242, 243-244 
Registrador acumulativo, 170-171 
Regla polimórfica, 464-465 
Reintegración, veáse Recordatorio 
Relaciones de señal, 96-100, 309-311, 319-320 
Relevancia del estímulo, 125-126, 127-129, 
178-179 
Relevancia EC-El, 125-128, 178 
Reloj interno, 452-453 
Repaso, 439-440, 442-445 
Representación, 136-138, 406, 408 
Resolución de problemas, 23, 245-246 
Respuesta condicional 
como función del EC, 143-144 
como función del El, 135-136 
como indicador de las asociaciones, 131- 
133, 138-139 
como interacción de procesos condicionados 
e innatos, 145, 146 
como «preparación al El, 375-376 
definición, 82 
en el condicionamiento imhibitorio, 105- 
107 
funciones biológicas de la, 145, 146, 147, 148 
modelo de la respuesta compensatoria, 140- 
143 
modelo de sustitución del estímulo, 134- 
135, 136-138 
Respuesta de alarma, 55-57, 60-61, 62-64, 
65-66 
Respuesta de la membrana nictitante, 376-377 
“Respuesta de la meta, 379 (véase también 
Respuesta fraccional anticipatoria de la 
meta) 
Respuesta de orientación, 46, 57 


Respuesta de sobresalto, 54-55, 61-62 

Respuesta emocional condicionada, véase Su- 
presión condicionada 

Respuesta fraccional anticipatoria de la meta, 
379, 381, 386 (véase también Mecanismo 
rm-em) 

Respuesta incondicional, 82 

Respuesta de interin, 270, 271, 272, 308 

Respuesta terminal, 269-280, 307 

Respuestas competidoras, véase Competición 
de la respuesta 

Respuestas incompatibles, véase Competición 
de la respuesta 

Retraso mental, 289, 408 (véase también 
Autismo) 

Retroalimentación de la respuesta, véase Es- 
tímulo retroalimentador 


Rueda giratoria, 247-248, 326, 348, 363 


Saciedad, 138, 203 

Salivación, 80-81, 136 

Salivación anticiparorta, véase Condiciona- 
miento salivar 

Saltamontes, 50 

Secuencia monotónica, 456-461 

Secuencia no monotónica, 456 

Seguimiento del signo, 88-91, 94, 105-106, 
123-124, 131-132, 134-135, 271-272, 318, 
372-375, 393-394 

Seguimiento del signo negativo, 393 

Selección de la respuesta, 266-272 

Selección natural, 30, 272 (véase también 
Adaptación; Evolución) 

Semejanza EC-El, 129 

Sensibilización, 57 
adaptabtlidad, 57-58 
ámbito, 57-58 
análisis neurológico, 58-60 
curso temporal, 63-64 
efectos de la intensidad y frecuencia del 

estimulo, 67-68  ' 

en el condicionamiento clásico, 96-97 
especificidad del estimulo, 65-66 

Seres humanos, en investigación, 114-117, 
325-327 

Seudocondicionarmiento, 96 

Sílabas sin sentido, 27 

Síntesis de proteinas, inhibición de, 436 

Sisrema de estado, 60-62 

Sistema E-R, 60-62 

Sistema inmunológico, 113-114 

Sistema límbico, 243 

Sistemas de respuesta bidireccional, 106, 110 

Sobrecorrección, 351 

Sorpresa, 153-158 

Succión, 46, 50, 52, 53, 61 

Supraigualación, 215 

Supresión condicionada positiva, 392 

Supresión condicionada, 86-89, 105-106, 107- 
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108, 137-139, 151-153, 158-159, 332-334, 
336-337, 360-363, 386, 389-390, 392, 444- 
445 (véase también Condicionamiento del 
miedo) 
Sustitución del estímulo, 135-139, 378-379 
Sustituibilidad, 261-262 


Tabula rasa, 26 

Tasa de respuesta, 170, 208-209 

Tasa relativa de reforzamiento, 213 

Tasa relativa de respuestas, 213 

Taxia, 51 

Teoría de la regulación conductual del refor- 
zamiento, 245-265 
en la conducta humana, 268 
frente a teorías tradicionales del reforza- 

miento, 255-256, 257 

y Conceptos económicos, 257, 259-263 
y a del abastecimiento óptimo, 262- 

Teoría de la respuesta consumatoria, 245 

Teoría de la respuesta emocional condicionada 
del castigo, 360-362 

Teoría de la señal de seguridad, 339, 344-345, 

Teoría de los dos procesos, véase Evitación 
teoría de los dos procesos; Mecanismo rm- 

em, Teoría moderna de los dos procesos 

Teoría de Spence del aprendizaje de discrimmi- 
nación, 295, 296-297, 304-306 

Teoría de Stadon de la discriminación del 
estimulo, 307-308 

Teoría del castigo de Premack, 364 

Teoría del oponente condicionado en el condi- 
ciomarmiento clásico, 156 

Vera del proceso dual de la habituación, 59. 


Teoría del reforzamiento de Premack, 246-252 
qeoría económica, 256-262 
eoría moderna de los dos - 
Ss 400 procesos, 386-391 
Teoría secuencial, 232-233, 460-461 
Terapia de aversión 
para el alcoholismo, 115 
para el consumo de tabaco, 128 
para la orientación sexual, 391 
Terapia de conducta, 58, 114-115, 118-119 
128, 170, 219, 261, 340, 367-368, 391, 
476-478 
Termotaxia, 51 
Territorialidad, 147, 178-179, 263-264 
Testosterona, 148 
Tiempo fuera, 351 
Tiempo interrespuesta, 210 
Tigmotaxia, 348 
Tilapiz Mozambica, 51-52 
Tolerancia, véase Tolerancia a la droga 
Tolerancia a la droga, 72-73, 141-143 
Topografía de la respuesta, 216, 313-314 
(véase también Moldeamiento; Perrinencia 
en el condicionamiento instrumental) 
Toxicosis, 91 (véase también Aprendizaje de 
aversión al sabor: Enfermedad) 
Transituacionalidad, 238-239 
Transposición, 303-305 
Tritones, 38 


, 


Ulceras, 105 
Unidades conductuales, 22-23, 178, 249 
Unidades de respuesta, 23, 178, 249 


o 


Valor de la respuesta, 250-251 
Velocidad, 168 
Violín, enseñanza, 18] 
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CAPITULO 2. Figura 2.7, de «Sensitization 


of the Rat Startle Response by Noise», por 
M. Davis, Jowrnal of Comparative and Phy- 
siologscal Psychology, 1974, 87, 571-581. 
Copyright 1974 de la American Physiolo- 
gical Association. Reproducida con permi- 
so. Figura 2.8, de «Factors Governing the 
Changes in Strength of a Partially Inborn 
Response, as Shown by the Mobbing Beha- 
vior of the Chaffinch (Pringilla coelebs): 1. 
The Nature of the Response and an Exa- 
mination of lts Course», por R. A. Hinde. 
En Proceedings of tbe Royal Society of 
London, Series B, 1954, 142, 306-331. Re- 
producida con permiso. Figura 2.10, de 
«Long-Term Retention of the Habituation 
of Lick Suppression and Startle Response 
Produced by a Single Auditory Stimulus», 
por R. N. Leaton, Journal of Experimental 
Psychology: Animal Behavior Processes, 
1976, 2, 248-259. Copyright 1976 de la 
American Psychological Association. Repro- 
ducida con permiso. Figura 2.11, de «Ha- 
bituation: A Dual-Provess Theory», de P. M. 
Groves y R. F. Thompson, Psychological 
Revsew, 1970, 77, 419-450. Copyright 1970 
de la American Psychological Association. 
Reproducida con permiso. Figuras 2.12, 
2,13, 2.14 y 2.15, de «An Opponent Process 
Theory of Motivation: 1 Temporal Dyna- 
mics of Affect», por R. L. Solomon y J. D. 
Corbit, Psychological Review, 1974, 81, 
119-145. Copyright 1974 de la American 
Psychological Association. Reproducidas con 
permiso. 


CAPITULO 3. Figura 3.3, de «Acquisition 
and Extinction of the Classically Conditio- 
ned Eyelid Response in the Albino Rab- 
bit», por N. Schneiderman, IL Fuentes e L 
Gormezano, Science, 1962, 136, 650-652. 
Copyright 1962 de la American Association 
for the Advancement of Science. Reprodu- 
cida con permiso. 


CAPITULO 5. Figura 5.9, de «Learning 
when Reward Is Delayed: A Marking Hy- 
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pothesis», por D. A. Lieberman, D. C. 
McIntosh y G. V. Thomas, Journal of Expe- 
rimental Psychology: Animal Bebavior Pro- 
cesses, 1979, 5, 224-242. Copyright 1979 de 
la American Psychological Association. Re- 
producida con permiso. 


CAPITULO 6. Figura 6.2, de A Primer of 


Operant Conditioning, por G. S. Reynolds. 
Copyright € 1975, 1968 de Scott, Foresman 
and Company. Reproducida con permiso, 
Figura 6.4, de «Relative and Absolute 
Strength of Response as a Function of Fre- 
quency of Reinforcement», por R. J. Herrns- 
tein, Journal of tbe Experimental Analysis 
of Behavior, 1961, 4, 267-272. Copyright O 
1961 de la Society for the Experimental 
Analysis of Behavior, Inc, Reproducida con 
permiso. 


CAPITULO 7. Figura 7.7, de «Life in a Clo- 


sed Economy: The Ecology of Learning and 
Motivation», por G. H, Collier. En M. D. 
Zeiler y P. Harzem (Eds.), Advances in 
Analysis of Behavior. Vol. 3: Biological 
Factors in Learning. Copyright € 1983 de 
John Wiley £« Sons, Inc. Reproducida con 
permiso. 


CAPITULO 9. Figura 9.7, de «Extinction of 


Avoidance in Rats as a Function of Dura- 
cion and Number of Blocked Trials», por 
R. Schiff, N. Smith y J. Prochaska, Journal 
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